MonarchBase - Protein-coding gene

DPOGS210722
Transcript	DPOGS210722-TA	2661 bp
Protein	DPOGS210722-PA	886 aa
Genomic position	DPSCF300013 - 80280-87125
RNAseq coverage	539x (Rank: top 23%)

Annotation
*Heliconius*	HMEL002419	0.0	60.63%
*Bombyx*	BGIBMGA006333-TA	0.0	60.41%
*Drosophila*	CG2943-PA	9e-163	38.63%
EBI UniRef50	UniRef50_E2BNN6	1e-172	38.91%	Uncharacterized protein KIAA0090-like protein n=7 Tax=Formicidae RepID=E2BNN6_HARSA
NCBI RefSeq	XP_624458.1	3e-178	38.74%	PREDICTED: similar to CG2943-PA [Apis mellifera]
NCBI nr blastp	gi\|157138185	1e-175	38.41%	hypothetical protein AaeL_AAEL003785 [Aedes aegypti]
NCBI nr blastx	gi\|157138185	6e-173	38.49%	hypothetical protein AaeL_AAEL003785 [Aedes aegypti]

Group
KEGG pathway
InterPro domain	[683-885] IPR011678	2e-47	Domain of unknown function DUF1620
	[23-511] IPR011047	1.1e-09	Quinonprotein alcohol dehydrogenase-like
Orthology group	MCL13635		Single-copy universal gene

Nucleotide sequence:

>DPOGS210722-TA
ATGAAATGGTTTATTATATTCTTTAGTTTAATCAATCTCTCAGTTTGTATATATGAAGACCAAATCGGCAAATTTGACTGGCGTCAGACATACGTTGGTCGTATAAAATTTGCACAGTTTGATACAGTTTCTACGGCAAAAAAAATTATAGTTGCTACCGAAGAAAATGTACTAGCAGCTCTTCATTTAAAGACTGGTGAAGTTGTCTGGCGGCATGTATTTGAAAATGCTTCACCTGGTAATATACATCTGCTGCATGTGGGAGAGAAGATCACCACAGTGACCGGAGATAATCCAATGAATCAGTCTCCTACCCTGAGCGCTACAGGTGTACTGATGTGGGAGTGGACTCTCATGCTGCAAGATGACAGTAGAGCTGATTTCTCCGAGTGGTGGGTGCAAAACGGAATGCTTGTGCACATGCTGCCTGTCTTTAATTCTCATCTTGAAGTCACTATGTACAATGTGATGTCGGGAAGCAACAGAGGTGCTACATCTAAGTTACCAGCTATCTGGAATAATGAAGGGCAAGTAATTTGCATTTGTGTCCTCACTGCCCCCTATTACACTTGTGTGTCGGGTGAATTTGGAAGTCAAATCTTGGTGTCAATGGATGTCACAGCGAATGCCATACAAATGATAAGCAAACCGCTATCGAACATCATTGAAGGTGCTGTCGGTAACTTGCGTGCATTAGACGGTAACAGTGTCATCCCTGGCTTCATAGTGGACGACAAGAAGATAGTGCTGATTAAGGAAAATGATTTTAACGTTTTGAACGTCAAGGTTGAAGATACCTTAGCGAGTGCAAGTATCGCCGATGGTGCTAGAGGTCCTCTCGTGCTGCAGATATGGACGAATTATGCTAAAGGCTACCAACTCATAGCACACACACTGTCTGGTCAATTAATACCAGAAATACACAGCCCTGATTCATTCCTCGATATCCCCGAACCGGAGTTGTTAGCGGTGACATGTGCCCGCGACCAGCTCGCCTGTCGCTTGCTCATCAACGCTGCCGATGACGCTGTACATTTGGTACAGCAAGGAGGTGTAACGTTATGGTCTCGTGAGGAATCCCTGGCTAATATAAAAAGCGTGGAGTTTGTGGACCTTCCAGTGTCAGATGCTGATGCTGCTCTGGAATCAGAGTTTGATCAGAAAGAAGGTTCCGTGTGGTGGTCGTTCGTCCGTCGCCTCCAGTCGCAGTACCAGCAGCTGTCGGCTGCGGTGGAGCGTCTGCGGAGCGGGGAGGTGCTGGACCGGGGCTCCGCCTCCCTCCACCGGGACTACTTCAACCTGCACAGGATCATGGTCCTTGTCACGGAAGCTGGGAAGATCTTCGGTATGGACAACCTGTCGGGGTCGCTGGTGTGGCGCCTGTACTTACCGACCCTCTCCGGCGCCCGGACCATACTGCTGAGGAGAGCGGCGCGGCACCCTCACACAGCCATGATCACCATCGTCGGCACACACACGGACACAGGCAACGGTTACATAGTGACCCTTGACCCCATCACCGGGAGGATGGTCCCCGAGCACACCGTCACGCTGGACGTGGGGATAATGCAATGTATGACGTTACAGGAGACGGGAGACGATCAGCTGAGAGCTCTCATTGTACTGGACGAGGACGAAGCCGTTCAGGTGTACCCGCCGTCCGCCGCGTCGCTCGTCCACAATGTGCACATGTATGTAGCGGACCAGGACACGGGCAGGGTCAGGGGGTACGCGATCAGATATAACGGAAGGGAGGCGGTGGCCGAGCGGACCTGGTCGATGTCCCTGGGCGGGTCGGGTCCGGCTCGTATCGTGGCCATGTCGTCCCGGTCCCGCCTGGAGCGCGTGAGGTCCCCGGGGCGCGCGCTCGCCGACCGCAGCGTCCTCTACAAGTACTCCAACCCAAACATGCTGCTGTTTGTTGTCGAGAAACCCGATCCGACTCATAAAGAGGTCGTGACGGCGGTGGTGGTGGACGCGGTGTCGGGCGCGGTGGTGGGCGCCTCCTCCCACCGCCGAGCGCGCGCCCTGCCGCTGGCGGTGCACGCCGACAACTGCTTCGCCTACCTCTACAGGAGCGACAAGCACCGGAGAGTCGAGATAGCCACGATGGAGCTGTACGAGGGTAAGGACCGCTGGTCCCCGGCCGGCGAGCCGTTCAGCTCGTCCGCCAGCTGGCGCACGCCGGTGGTGGAGCGTCAGGCGTACATCCTGCCCGCACTGCCCTCCGCCGCCGCCTTCACCATCACCGAGAGATCGCTCACCGACAGACACGTGCTCTTGGGCCTGTCGTCGGGCGGCGTGGTGGAGGTACCGTGGTCGTTGGTGGAGGCGCGGCGCGGCGCGGCGGGCGAGGAGTCCGTGCTGCCCTACCTGCCCGAGCTGCCCCTGACGGCGGACCGCGTGCTCTCCTACAACCTCACCCTGCACCGCCTGGCCGCGCTGCACACCGCGCCCGCGGGCCTCGAGTCTACCAGTCTGATGCTGGCCACCGGACTGGATCTGTTCTACACGCGAGTGGCGCCCTCTAGGACGTTCGACCTGCTGAAGGACGACTTCGACTACTACCTCATAACGATAGTGCTGGCGGCGCTCGTGCTGGCAACGTACGGCACCAAGTACCTCGCCTCCAGGAAGACGCTCAAGATGGCGTGGAAGTGA

Protein sequence:

>DPOGS210722-PA
MKWFIIFFSLINLSVCIYEDQIGKFDWRQTYVGRIKFAQFDTVSTAKKIIVATEENVLAALHLKTGEVVWRHVFENASPGNIHLLHVGEKITTVTGDNPMNQSPTLSATGVLMWEWTLMLQDDSRADFSEWWVQNGMLVHMLPVFNSHLEVTMYNVMSGSNRGATSKLPAIWNNEGQVICICVLTAPYYTCVSGEFGSQILVSMDVTANAIQMISKPLSNIIEGAVGNLRALDGNSVIPGFIVDDKKIVLIKENDFNVLNVKVEDTLASASIADGARGPLVLQIWTNYAKGYQLIAHTLSGQLIPEIHSPDSFLDIPEPELLAVTCARDQLACRLLINAADDAVHLVQQGGVTLWSREESLANIKSVEFVDLPVSDADAALESEFDQKEGSVWWSFVRRLQSQYQQLSAAVERLRSGEVLDRGSASLHRDYFNLHRIMVLVTEAGKIFGMDNLSGSLVWRLYLPTLSGARTILLRRAARHPHTAMITIVGTHTDTGNGYIVTLDPITGRMVPEHTVTLDVGIMQCMTLQETGDDQLRALIVLDEDEAVQVYPPSAASLVHNVHMYVADQDTGRVRGYAIRYNGREAVAERTWSMSLGGSGPARIVAMSSRSRLERVRSPGRALADRSVLYKYSNPNMLLFVVEKPDPTHKEVVTAVVVDAVSGAVVGASSHRRARALPLAVHADNCFAYLYRSDKHRRVEIATMELYEGKDRWSPAGEPFSSSASWRTPVVERQAYILPALPSAAAFTITERSLTDRHVLLGLSSGGVVEVPWSLVEARRGAAGEESVLPYLPELPLTADRVLSYNLTLHRLAALHTAPAGLESTSLMLATGLDLFYTRVAPSRTFDLLKDDFDYYLITIVLAALVLATYGTKYLASRKTLKMAWK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: