MonarchBase - Protein-coding gene

DPOGS210130
Transcript	DPOGS210130-TA	2997 bp
Protein	DPOGS210130-PA	998 aa
Genomic position	DPSCF300017 + 1729584-1745957
RNAseq coverage	435x (Rank: top 28%)

Annotation
*Heliconius*	HMEL007197	0.0	59.01%
*Bombyx*	BGIBMGA000237-TA	0.0	57.22%
*Drosophila*	CG3764-PA	1e-47	30.93%
EBI UniRef50	UniRef50_D6WL07	1e-53	34.54%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WL07_TRICA
NCBI RefSeq	XP_970594.2	2e-54	34.54%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]
NCBI nr blastp	gi\|189237365	4e-53	34.54%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]
NCBI nr blastx	gi\|270007081	8e-78	32.10%	hypothetical protein TcasGA2_TC013532 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL18245		Insect specific

Nucleotide sequence:

>DPOGS210130-TA
ATGGCATTAATAGAAAACATCTTTAGAAGAAGAAAAATTGATTATGCTTATTGGGACTCACGAATCAGGGGCAGAGCTGGTGAATTAGCTTTGGAGCAAGTGAGATTGCTTCTGTATAAGGAATGTGATCGTAGAGGAAGAAAAGTGCTTTTTGATTCATCTACTATTGATAAAGTATTGTCTGCAAAAAATGACAGACCAGATATCAAAATGGAAAAAATTCCCTGCATCGTTGAAGTTACAGATGGAAACTCATACATTTACAAAGGTCAGGCGACGGATGCGAGTGTCCTCGGTGAGATGATATTCGGAGCGGTGGCAATGAATTGCAAGAGCGTTTCCTTTAAGATACATATCATGAATGAACCGAAAAGGTTAATGTGCACCAAGTTGTTCAGTGTGCCTGTATCAAGGAAGACCAGTCGGATGGAAAGGAAGGCAGATAGTTGTAGCGGAGATGTCAATAGATCGAGGCCTTTGAATATGACGTTACTGAGAGAAGAGGGATTGGCGTTGAGCTTCTCATTGGATAGAGGCGATTCTGGTTTCTGTGAGACATCTTCGTACAGCAGTTTCGGTACAAGCTTCGATTACCTCACCATGTTTCACGACTGGGATCAGAACGGCGACGAACACTACTTTTATAGTCCAAGTTCAAAGTTAAGCGCTTCAAGCGGTAGTTTAGCTAGACGTACGTCCCATAGCTACGCTACTCGCTTCGATTTCGGGAATACTTTGAAAGTACCCACCAGTAGTACAGTGTGTAGCGCGGATTCGCAGTTATATAGCAGTTCAACGAGTACGTCAGACAGTTTGGCGAGCACTGCGTCTACACGACGCGCTAAACTCGGACTAGCGTTGCTAATTACCTTTACTGAATCTGATGATATGGAGTTGATCCGTCGCTGTTTAGAGTTATCACCACAGCTGCGGTCGCTCGTGTGTCGTCTACGTCTCGCAGCTCTCACCGCTGGCTCCGATGCATTCTTCGTGTCCACGCTACACACGGCCGCAGGACACGCGAGGAGATGGTTGTCGGAGTTATTGTTCGGACCGCGGCTTCATCCCACGTGGCTGCTTCTCGTGTCCAGTGAGCCTTCACAGGCAAACAAAATGGCCGACAGGCTGATAGAAGATATATGCTCAGTACTAGCTATCGGGGACACAAAGGATACTAACTTTTTCATCAGCACCCTTCTAACGCACGTGTTAACTCACCACCTCGGCTGGGTGACCACTGTAAGTCCCTACGACAGAGTGGAATCAAAAAATACAGGAAATTTGGACACTAAGAGGCCATACAACGCGCTCTGGGCACAACTGACGGATCTCTGTGGATGTATAGGATTTCCACCGAAATCCGCTAGGACCATCATAACCGGCAACAAGAATATACTGTTCATTAATAGATTACTGGACGTTCTTACTTATTTTATACGTTGCGGTGACGTTAAGAAGAACGATTTCGTGTATCGAGACTGTTCAGTGAGCGAGGTCAAAGTCATCAATGTGAAAGCTGCTAGTGAAAACGATAAGTGTGATTTGAATGACTATAGTACAAAATATAGCTTGAAAGTTCCATCATACAGCGGTAGCAGTGCGAGTACTTTAGTGTCCAGTGAGGTGTCTTTGAAGAAATCGGCAACGTTCGTTGATTTAAATAATGTGCTCTCTAATTTTGACTTTGCATCTGATAATGGGAGCAAATTGAGACGGCATCCGACCATGATGATCTCATTGAAGGATTCTGACTCCAGCTCAAACGCGTCATCAGAAGAATGTGAGAAGAATGTTGTGTTCGTGCTCGGTGATGATGAGAAACTTGTGGGGTTGAAGAATAAATCAAACGGTAAGAGGAATCTAAAGAAAACTTCAAGAGCTTCGGAGACAGAGGAGAAAGAGAAAGAGGAACGTGACGACGTGAGCCAAGAAAAATACAAGTCATCACAAAGCCCGAAGTGCTGTGACCAAACACTCAAACATTCCAAGCCCATAAAACATTCCGGTTTTAAATTCGAGTTCGATAAATATCCGCAGATAGTAACTAATTATATGAAGAGCAAGAACTTAGAGATTCTAGATAGACATTACATAGGGAAGCCGGGGAACCTGAAACTGGACAATTTCCAGTTCGATCCAACATTCGTACCTCCGATACAGGAAGACAGATGCGAGACCTGTTACAAGTGCCAGCTGATGGAGTCCATGTTGCAAACTCCCACCAACGCCTCCGAAATGGAATATATGAACGATATACCGAGACAATCGGAACCGCAGATCGCTAAGGAGACGATAGTCCAAGAGGAAATGACGCCCAAGACATTTGTTAGGAAGCGCAAAGAGAGTACCGTCGTCGTGAATGTCAGGAAGCCTGTGACCGAAGTGAAGGTGAAGGTGGACGAAGAAAAAGATAACAATGTAATAGAAGTGAAGCAAGTTTTAGAATTCCCTGTTCCCCAAGTGTGTCCCATCGCTAAAACTGACTGCAACGATACACTTCTAGGCGGCATTACTGACCACTATGTACCTGATCTTATATTACAAGGAACAATCGCTAATCCGGACACATGGGAATCGGAACTTCGGAGGGATTTAGATCTGACGTCGTATTTGAACAAGAGCTCTGATTCGCCTATACAAACTGTAGCCATAGTCGGTGACACTAATACTTGGCAGGTGAGAGTTTGTGGGCGATCAGTTGGTCCTATGGGAGGGGGATTGTCGCCACTCGTTGGTGGTATTTTGGACGCTTTACCCGCCATGAGAAAAGCCAACGTACCCGCCGCTCAGTGCCTACTATTTTTGGAGAGCAAACTCCGCGAATTCTGTGTACTATCAAAAACTTTAGCCGACATATTGATGTCCACCGACTTTTGTGATATAGCAACACTAACAAAATCTTTGAATGTGGATGTTAACGACGTCCCTCTATTATTGGCGGTCGCTACAACCCACACGCCGGAACTAGCTACTAGATATGGTATTAGCTATAGATGA

Protein sequence:

>DPOGS210130-PA
MALIENIFRRRKIDYAYWDSRIRGRAGELALEQVRLLLYKECDRRGRKVLFDSSTIDKVLSAKNDRPDIKMEKIPCIVEVTDGNSYIYKGQATDASVLGEMIFGAVAMNCKSVSFKIHIMNEPKRLMCTKLFSVPVSRKTSRMERKADSCSGDVNRSRPLNMTLLREEGLALSFSLDRGDSGFCETSSYSSFGTSFDYLTMFHDWDQNGDEHYFYSPSSKLSASSGSLARRTSHSYATRFDFGNTLKVPTSSTVCSADSQLYSSSTSTSDSLASTASTRRAKLGLALLITFTESDDMELIRRCLELSPQLRSLVCRLRLAALTAGSDAFFVSTLHTAAGHARRWLSELLFGPRLHPTWLLLVSSEPSQANKMADRLIEDICSVLAIGDTKDTNFFISTLLTHVLTHHLGWVTTVSPYDRVESKNTGNLDTKRPYNALWAQLTDLCGCIGFPPKSARTIITGNKNILFINRLLDVLTYFIRCGDVKKNDFVYRDCSVSEVKVINVKAASENDKCDLNDYSTKYSLKVPSYSGSSASTLVSSEVSLKKSATFVDLNNVLSNFDFASDNGSKLRRHPTMMISLKDSDSSSNASSEECEKNVVFVLGDDEKLVGLKNKSNGKRNLKKTSRASETEEKEKEERDDVSQEKYKSSQSPKCCDQTLKHSKPIKHSGFKFEFDKYPQIVTNYMKSKNLEILDRHYIGKPGNLKLDNFQFDPTFVPPIQEDRCETCYKCQLMESMLQTPTNASEMEYMNDIPRQSEPQIAKETIVQEEMTPKTFVRKRKESTVVVNVRKPVTEVKVKVDEEKDNNVIEVKQVLEFPVPQVCPIAKTDCNDTLLGGITDHYVPDLILQGTIANPDTWESELRRDLDLTSYLNKSSDSPIQTVAIVGDTNTWQVRVCGRSVGPMGGGLSPLVGGILDALPAMRKANVPAAQCLLFLESKLREFCVLSKTLADILMSTDFCDIATLTKSLNVDVNDVPLLLAVATTHTPELATRYGISYR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: