MonarchBase - Protein-coding gene

DPOGS208706
Transcript	DPOGS208706-TA	4053 bp
Protein	DPOGS208706-PA	1350 aa
Genomic position	DPSCF300043 - 237593-249283
RNAseq coverage	296x (Rank: top 38%)

Annotation
*Heliconius*	HMEL015248	0.0	56.14%
*Bombyx*	BGIBMGA003350-TA	0.0	49.55%
*Drosophila*	CG7065-PA	4e-28	31.35%
EBI UniRef50	UniRef50_Q16Y01	2e-74	33.56%	Putative uncharacterized protein n=1 Tax=Aedes aegypti RepID=Q16Y01_AEDAE
NCBI RefSeq	XP_001659440.1	3e-75	33.56%	hypothetical protein AaeL_AAEL008714 [Aedes aegypti]
NCBI nr blastp	gi\|157119593	6e-74	33.56%	hypothetical protein AaeL_AAEL008714 [Aedes aegypti]
NCBI nr blastx	gi\|197313776	3e-130	32.86%	uncharacterized protein CG7065 homolog [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL26689		Lepidoptera specific

Nucleotide sequence:

>DPOGS208706-TA
ATGGATCTTCCGGACTGTCCTCCGGGAGCCGAGGGTTACGAGGATACAGTCACTGAAGTACCTAAAAAGATTGATTCGGAAGACGCAGCGGCCTGTACTAAGGCGGAGCAGGAGTTCCAGCAGCATCTGAACAGTCTCAAGATCAAAACCGAGGATGGCAACTACCGCTGCATGGTGGAGAGACGCGGAAGAGATGTCTCAGGGAAGTGGATATACTTGTGCTATCCATGTGCAGCCATGTGCAGTGGGGAGAGGATCCTGCAGACTCATATATCAGGGAAGAAGCATAAAGCTAAGCTGTCAATGAGAAATGTTTGGCCATTGAGTATATTCAATAACCATCCATATGTGTCGAATTCAAACTCCAAGTCTGCAGCTACTGAGACGGTGCTGCAAAAGATGGCGGAGGAAGTGGAGATGTTCAAGAAGAATCCCTCCGAGTTGGATCTCAAGTATGATAAGTACCGGGAAGTGAGGTGTCATATACAGGACACACTTGATGCTGTCAAGGCTCCACTGCTAGGTATCGAGTATCTGATCGAGCATCCCCCCGAGCAGGCTCACTATGAACCTTCATACATGTGTACTCTGTGCGGCAAGCAGGGTCACCCCCGGACTATTGTCAATCATCTAACATGCTTCTGGCATCGATACAACTATCTACTTCGTCACTTTAACAAGGCCTGCGCCGCGCTGACTCCGTACCGGGCTCAGGCCAAGTACCGCGAGGGTGTCGCCATCATCATGAACAGGCTGGCGCAGCGCATCCAGGACAAGTACGGGCGACTGAGACCCGTGAACCTCGACAAGGAGGACTACGAGAAGGAGAGAGACCAAATACATCAGTGGATCTTCCGCGGCTACCACTTCACGGAGAAAGATAGCTGTACTTTCGAAGAAGTTGTGGACGTTGACTTGATTACGTCTCTAGATTCTACCAAGACTGCAGGAGGGAGAATCACATCTAACAGGGAGCCGTCGCCTCCAGTCGTAGCGGCGCCGTCTAAACCTTTCGGTTCTAAACGTAACCCTCGACGTCGCGGCTCAATGGAGTCGCTGTCGGACGTGAGCGACGAGCCTGACATAAGAAGCAACAAGGATGACAAAATGTTCAAAGGACGAGGCGAACCGCCGCGGTACGAGCCTTACGGGTCCCGCAGGAGAACCAGTCCTTATCCGGAAAAGGGTTCAACGTCTCGGCCCCACAACTACTCGTACAAGGTGAAGCTGGCTGACGAGAAGTGTGCTGCGGCCGAGCAGGCGGCCAGGAGGGCCAGGGAGTACCACGAGAAGAACCCGGAGAAACATCCGCTGTACCCGGACGAGTGGAGGAAGTTCTGGAACCGGAGATACAAGGAGATACAGGCCGAAGGCAAAGATCCATCGAAATACGACTTCAAGCCGGAGTGGATTGTGTACTGGACGGGGAGGATGAAGGAGCTGCACGAGGAGGAGCTCAAGACTACGGTCCTGGAAATATACAGGAGGTTGAGACTCACACCGCCTGATGCAAGAGAGAAACGTCGTTCGTCTGACCGCCGCAAATCCTCGGAACATCGTCGGTCCGCTGATAGAAAGAGATCCCTCGATAGAAGGAGGTCAGCTGAGAGGAGACGATCAGCTGACCGCAGGAGGTCGGCTGAGAGGAGGCCGTCCGCGGACAGCAGACACGCCGCGCCCGCCGCTAGCAGGCACTCGCCCTACAGGCGGACCCCGGAACATAGGAGGAAGTCCCCGGACCGCAGAGATCGCAGGTCCCCAGGTCACACTCGCACCGCACCGCGTCGCTCCCCTCTGAGGCATCTTCGCACACGATCCAGGAGTCCTATACATAAAGGGAGCAGTGTTCGTCGTCGCTCGCCGCTGTCTCGCCGCGGGTCGGTGCCTCGCAACCACAGCCCCTCCCGCGATCAACCCTCCATGCAGACCGTCCTTATCTCGGACGATGAACTTAAACCGGACGACGGTCTCTCTCCTTGGAACTCGGCGGAGTCCCTGGGTTCCCTTCCGGAGGCGAGGTCCCCGGTCCGTCGCTCGGCCTCCACAGGCGTATCTAAATCGTCTCGCAGACAAGATTTCCACAAACAGGACTACGACGCTGAAAATGTAGTTGCAACTTTGAGACTGCTAGTAGCTCTAGAAGACTACCTCGGCAGCTTGGGGCCTAAGATCGTAGATTTGTTGGCAGATGCGCTTAAGATGGAAAAGGACAAGGCAAATTCGTCCGAGGAGTTGCTCGACAACGAGACGGCGGTAGTGTTGATCGAAACGGCCAAAGAAAAATTGAAGGGAGCGGCTCAGGCCGGACTAGTCACTGGCAGCGCCGCCGCCGCCGTCAGGACAGCCGTAGTGAGGGCAGCCGCGACCCTACACGCAGCCGACAATAGACTGAAGAAGAAGAAGGAAAGCAAGGAGTGTTCCGGCGGCGGCGGCGTCCCGGTGGTGGGCGTGGGTGAGGTGGACCGAGCACAGATCGCTAAACAAATGGCAGCGGCTCTAGTGGCTCAGGGAAAAACAGACGTCTCCTCGGAGGAATTGGCTCAGCTTGTTGATGCTGTTGTGGGTATGGCCGAAGCGAAAAAACGCGAAGCGGAATCTAAAAAGAAGGCTGAAGCACGAGCCAGCAACAATCAGACGGCGCGACAATCGCTGGCGGCCTCGGGGACGACATCCGCGCTGAAGATGCTACAGTTCGCCTACGATGATAAAAAGACTGACAAAGAAGACGTTCCGGACGTGATGGACGGCCTGTCGGACTCAGATCTGGAGACTCTCCTTAAAAACTTCAACGAGTTATCGGCAGAGGAACAACATAGCCTCATAGCCTATCTTAAGAAGCTTGAAGCTCGAGAGCCGCAACGCGTGGAACGATTGCGACAGTATGTGAGCGCCGCGGCGACACACGTGCACGGGGACGCTGAGGACAAACCTAACGCCAAGGAACCGACTGTGGCCGTCGAAAGCGACGACGACGACTACACTGTGGAAGATGTGTTCAAATCGGCGACGCAAAAGGTAAAAGAAGATCAGATCCGCCAAGAAATGGAAATTGTGAAAAAATCATTGGAAGAGACCAAGGAATCTTGTGTTTTACTAGACTCGCCTCCAGCTAACTCGTCAGTTCCTAATATTATGAATAGCTTCTCATCAGCGACCGACCTCTTGGCCCTGGTTCAGGCTACGTTACAATCGACACCCGCACAAAACCCGGCCGTCGGTCAAGTGACGTCAGACGTAGTTATGAGTAGTACACAACCCAGGTCCTTCGGCGACCTGCCTGAATCTTTGAAACCTCAACCGCACTTACTTCCAACAGCAAATAAACAAACTCCTTTCATTCAGCAAAGTATGTCACAAATTTCTGCCAATGTAAGTAACATTGTTAATCAAAATAGTTTCCACAAAGCCAACCTTCCGTCTTGGGAGACTGGACAAGAGGCAATTTTAGATAGAGCCAATATACAAGAATTTGATAAAATTGACAACCAACAAGGAAGGGGTTATCAAGATAACTTTCATGACATATCCAGAGGATCCCAGGATAATTATTATCAAGGAAGTAGGAATCAGGATGGTAATTACTATCAGAAAGAACCAGAGTGTAATATTAATACAGGCACAAGGCTCGCGTACAACCAACAAAACAGTTATAATCAGACTTCAAAAGCAATGCACAATAATATGAATCAGGGACAGAATAATTTTAATCAAATACCTCAAGGGTCACAAGACAGTTATAATAATTATAATACAAATCCCAGCAGCTACAGCCAAAATAGAAGTCAAGGAAATTACAACCAAAACGCCAGAGAAAATCAGAATTCCTTTAACCAATTAGGTAGATTTGATAATAATTACAGTAACCCTGCACCGCGGAGTCCCATGGACAATTATAACTTAGGCCGAGGAGGTCAAGGCAACTCCAGAGGTCAGCAGGACGGCTCGTTTAAAAACCTAGGGCCGGAGGGATCCAGGCCGAGGCAGTCCGCTACTCGAGCCGGATCCAAACCCTCGATGGGTTCGCATATACGAGATATGACGGGGTGTAATTGA

Protein sequence:

>DPOGS208706-PA
MDLPDCPPGAEGYEDTVTEVPKKIDSEDAAACTKAEQEFQQHLNSLKIKTEDGNYRCMVERRGRDVSGKWIYLCYPCAAMCSGERILQTHISGKKHKAKLSMRNVWPLSIFNNHPYVSNSNSKSAATETVLQKMAEEVEMFKKNPSELDLKYDKYREVRCHIQDTLDAVKAPLLGIEYLIEHPPEQAHYEPSYMCTLCGKQGHPRTIVNHLTCFWHRYNYLLRHFNKACAALTPYRAQAKYREGVAIIMNRLAQRIQDKYGRLRPVNLDKEDYEKERDQIHQWIFRGYHFTEKDSCTFEEVVDVDLITSLDSTKTAGGRITSNREPSPPVVAAPSKPFGSKRNPRRRGSMESLSDVSDEPDIRSNKDDKMFKGRGEPPRYEPYGSRRRTSPYPEKGSTSRPHNYSYKVKLADEKCAAAEQAARRAREYHEKNPEKHPLYPDEWRKFWNRRYKEIQAEGKDPSKYDFKPEWIVYWTGRMKELHEEELKTTVLEIYRRLRLTPPDAREKRRSSDRRKSSEHRRSADRKRSLDRRRSAERRRSADRRRSAERRPSADSRHAAPAASRHSPYRRTPEHRRKSPDRRDRRSPGHTRTAPRRSPLRHLRTRSRSPIHKGSSVRRRSPLSRRGSVPRNHSPSRDQPSMQTVLISDDELKPDDGLSPWNSAESLGSLPEARSPVRRSASTGVSKSSRRQDFHKQDYDAENVVATLRLLVALEDYLGSLGPKIVDLLADALKMEKDKANSSEELLDNETAVVLIETAKEKLKGAAQAGLVTGSAAAAVRTAVVRAAATLHAADNRLKKKKESKECSGGGGVPVVGVGEVDRAQIAKQMAAALVAQGKTDVSSEELAQLVDAVVGMAEAKKREAESKKKAEARASNNQTARQSLAASGTTSALKMLQFAYDDKKTDKEDVPDVMDGLSDSDLETLLKNFNELSAEEQHSLIAYLKKLEAREPQRVERLRQYVSAAATHVHGDAEDKPNAKEPTVAVESDDDDYTVEDVFKSATQKVKEDQIRQEMEIVKKSLEETKESCVLLDSPPANSSVPNIMNSFSSATDLLALVQATLQSTPAQNPAVGQVTSDVVMSSTQPRSFGDLPESLKPQPHLLPTANKQTPFIQQSMSQISANVSNIVNQNSFHKANLPSWETGQEAILDRANIQEFDKIDNQQGRGYQDNFHDISRGSQDNYYQGSRNQDGNYYQKEPECNINTGTRLAYNQQNSYNQTSKAMHNNMNQGQNNFNQIPQGSQDSYNNYNTNPSSYSQNRSQGNYNQNARENQNSFNQLGRFDNNYSNPAPRSPMDNYNLGRGGQGNSRGQQDGSFKNLGPEGSRPRQSATRAGSKPSMGSHIRDMTGCN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: