MonarchBase - Protein-coding gene

DPOGS209922
Transcript	DPOGS209922-TA	1719 bp
Protein	DPOGS209922-PA	572 aa
Genomic position	DPSCF300180 - 203069-211908
RNAseq coverage	405x (Rank: top 30%)

Annotation
*Heliconius*	HMEL017298	4e-175	60.71%
*Bombyx*	BGIBMGA010925-TA	0.0	71.07%
*Drosophila*	CG16791-PA	5e-112	36.59%
EBI UniRef50	UniRef50_D6X2V3	4e-140	65.38%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6X2V3_TRICA
NCBI RefSeq	XP_967292.2	1e-138	64.15%	PREDICTED: similar to AGAP005275-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270014200	1e-139	65.38%	hypothetical protein TcasGA2_TC016285 [Tribolium castaneum]
NCBI nr blastx	gi\|270014200	3e-140	65.38%	hypothetical protein TcasGA2_TC016285 [Tribolium castaneum]

Group
KEGG pathway	nvi:100114326	1e-117
	K12386 (CTNS)	maps->	Lysosome
Orthology group	MCL16551		Insect specific

Nucleotide sequence:

>DPOGS209922-TA
ATGATAATTGAGTCGTGTAATAGATATGTTGTTTTCTTAGGTTGTTCGTTCCCGGTTCGCTGGCAGGGTCGCTGGTTCCAGTCCGGGGTGATCCAGCCCATCATGATAGACGGAGCTGTTCTCTCTAACAAGGGGAGGTGCCTCTCATCCGAGGGTGACAAGTTCCTTATTGTCGACGAGAAAGGCTGTTACCGCTGTGTCGTGATGCACGAAAAACATATTAATGTTCTACAATATAAAGAAACTTTCTGTCACCGTCGCGATGCCTTACCCCACCTCTGTTCTTCTATCACCGGCGATGCGTTGCTATACTCTATGTTCCGGGAGAGCGCCGAGCCCGTCGACTGCCCTCTCAAAGGACCCTTCTCATTCACTTATAACAGGGGCCACGGGGATTGCAAGATTCCGGCCTCATCCATCGAGAGCTGCACCGAAGATTCGAGACTGCTGCTCAACTACCAGGCGTGCCCTGACGTTTACGGATCAGAAAGTACAGTGGAGGAATTAGAATGCTTGGCGACGTGGAAGGAAGGTAGTTTGAGGTTCCTGGTGGGCAAGCTGCATCACAACCACGCCACCAGCAACGAGGACAGATACCGCTGCTTCGTGTACGAGAAGACAAATGGTATTGCATCAGGTAGTAATATGAAGGAGCCAGCTCCTGGCGGAGTGGAGTATAGAGTGGCGCAATCCGGGGACGCCACGTGCAACGGACTGTTCAGTGCCACTGAGGGCTCTCGGACCATGGCTTTGAAACGAGTTTCAGTTCGCTTCAACTGTCAGTTCCCTTCGTGGATGACCTTCTCTCACACGTGGCACACGCTGGACTTCAGCAGTAACTACACCTTCTACCAGCGTAACGCGACCCTCCGCATCACCAACCAGACCGGCTCCGAGATCAAGGTGTACTGCGTCAGCATCAAGGCCAGCTCCCCCAGCGGCAACTCGGTCGCCCTGGTCGCGCACTGGCAACACCACTGCGTGTCTCGCTTCGTGTGCGTGGTGCTGTATCGCCGCGACACCTTCATAGCGGAGCTGCAGCGAGGGTCTCCGGCCGCGCGGCCCGACGACGCCTGCTCCACGCATCACTTCAACGCCGTCACAGCGCCATACGTCACGCTCGTTGCTAGCAATCCTGAATCTAAAGAGTGTCCAGACTCAGGGAAATACGTGATATCGAACAGACGTCACAAGAGGAGTGACGGCGCGAGGAGCGCGGCGGTGGAGGGGAGGAGGAGAAATAACACTAGGACGTTCAGCTTTAATATAAGGAACATGTCCGACACGCCCACGCTGAGGAGCCGGAGACACACAGAGGCCGCGAACTGCGCGGGCGGCTACAACAGACTGGAGATCGGCTGCACCTCCACCAACAACATGGAGTTCTACTCCAGCTGCGACAACAGAGACCTCGTCACAGCGTACACGTGCCACGGCGGCTGGTATGAGGGTGGTTCGTCGTTCGTGGTGACGACCCCCGTGACCCGGGACAGCACCGCCGCCCGCCGGTACTGCTTCGTGTCCCGGGACAACCGCGGCAGTCTCTCGCTCACCCGCTCCCAGGATAACTGCGAGCGCGGGGAGAGAACAGCCGTCGTGTTTGACGCTGTGTTCACCGGTAAATGTCAAGACGAGCCCAACCACCAGCCGCCGTCGAGACCTCCGTCACTCTTCGTCGCCCTCCTGATGCTGGCCGCACAGCACGCGGCGCGGAGGTGA

Protein sequence:

>DPOGS209922-PA
MIIESCNRYVVFLGCSFPVRWQGRWFQSGVIQPIMIDGAVLSNKGRCLSSEGDKFLIVDEKGCYRCVVMHEKHINVLQYKETFCHRRDALPHLCSSITGDALLYSMFRESAEPVDCPLKGPFSFTYNRGHGDCKIPASSIESCTEDSRLLLNYQACPDVYGSESTVEELECLATWKEGSLRFLVGKLHHNHATSNEDRYRCFVYEKTNGIASGSNMKEPAPGGVEYRVAQSGDATCNGLFSATEGSRTMALKRVSVRFNCQFPSWMTFSHTWHTLDFSSNYTFYQRNATLRITNQTGSEIKVYCVSIKASSPSGNSVALVAHWQHHCVSRFVCVVLYRRDTFIAELQRGSPAARPDDACSTHHFNAVTAPYVTLVASNPESKECPDSGKYVISNRRHKRSDGARSAAVEGRRRNNTRTFSFNIRNMSDTPTLRSRRHTEAANCAGGYNRLEIGCTSTNNMEFYSSCDNRDLVTAYTCHGGWYEGGSSFVVTTPVTRDSTAARRYCFVSRDNRGSLSLTRSQDNCERGERTAVVFDAVFTGKCQDEPNHQPPSRPPSLFVALLMLAAQHAARR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: