MonarchBase - Protein-coding gene

DPOGS210055
Transcript	DPOGS210055-TA	2715 bp
Protein	DPOGS210055-PA	904 aa
Genomic position	DPSCF300017 - 971178-991441
RNAseq coverage	226x (Rank: top 44%)

Annotation
*Heliconius*	HMEL007411	0.0	90.67%
*Bombyx*	BGIBMGA012693-TA	0.0	84.65%
*Drosophila*	ko-PA	6e-170	43.32%
EBI UniRef50	UniRef50_Q9VP79	9e-168	43.32%	Knockout n=9 Tax=Sophophora RepID=Q9VP79_DROME
NCBI RefSeq	XP_001973575.1	1e-168	43.25%	GG13263 [Drosophila erecta]
NCBI nr blastp	gi\|194875311	3e-167	43.25%	GG13263 [Drosophila erecta]
NCBI nr blastx	gi\|51092053	6e-176	43.19%	RE48574p [Drosophila melanogaster]

Group
KEGG pathway
InterPro domain	[14-93] IPR019391	1.6e-32	Storkhead-box protein, winged-helix domain
Orthology group	MCL12294		Insect specific

Nucleotide sequence:

>DPOGS210055-TA
ATGCAATTGGCTAGAGTAGGGGACATCGAAGACTGTATCGTGACGCCGACCTACCAGGGCCAGTTCACGCCGCTGCCGGAGGCGCTCTGCGACTGCATCATGGACCTCACGACACAGGGTCAATCAGCGACATTAGAAAGTATAAGGACCTCCTTATCCTCCAAGTTCCCGTCGATGCAGACGCCGTCCCAGGAGGTGGTGTACGACACGCTGGCTCAGCTCATGCAGGAGAGGAAGATATACCAGACCTCGAGGGGCTTCTTCATTGTTACACCAGAACGTCGTCGTTCCCGTTCTCGATCGTCTTCTCGTCACCACTCCACCGAGGATGAGTGCAGCAGTCCTCGTACTATCCTCATGTCGGACCAGGAGGCGTTGCACCAGCTCTACGGAGAGATCACCACTGTCAGGGATGGCGCCGTCACACACCAATGTGTTCAGACGAACCTCGCGGATGTTATATGTGGAGGGAACCCAAACGACAAAGTTCTATACGGTAGACCCAACAAGCGCCGCAGCGCTTCGTTCCCTGCGCCCCGCTCCCTCGACCGGCGCCACTCCCTTCGGATCTTCGGCTCATCCAGCAAGTACTTGCAGCGATGCGCTTCCACACGTAGTTTGCACCACAAGCACAATACGACAGATAGCTCGTCATCCACCGACTACCCACCCAGTGTAGAATCTGCGTCGCCTAAGAAAGTGTCGTTGCTCTCCCGCTTATTCAGACGAAGCGGCCGCAGCAAGCAGACCCGCGCGATGAGCACCTTCTCTGCGCAGTTCCCGCCCACTGAGTGGTTCAACTCCAAGGCGGTGCATCTACACTGTGTCGCGACACAAACTGACTCTAAGGAGTCCTTGCAGAGCCAAACATCAATCGTTTCATCGTATTATGACGGTTCAGAAATCAGCAACCGATCGTCGACATTACCAAGACGACACAAGAGACATCTTTCAACCGAATCAGGTCTAGCGACGTCCATGCAATACGACCACTCGCCCGTGAGGCAGTCGAGCCCTAGTTCAGGCAGTCTCCCGAGGTCAACACTGAGTAGAAGTTCCACGAACAAAACTATATTGGACCATTTTGGATCACCTCAACGAAACAGCGAACCAAAATTAAGAGACAGTCCAAATGGAAGTTTACGGCGTGTGGATTACTCAGATAACTTAATGTCAACTAGTGGGCCTTCAAGCTTAGAGAGCAACACCCATAGAACACCGCGTAAAGATTATAGAAATGGACAATCGGATCTAAATTCGCCTATGAAAAGAGGTTATCACACGAGCGGTAGCAGTGGTCATTCAAGCTTAGAATCACATATATCAGATCGCACTTTGAAACCTTCACCTAGTCATACTAACGGGAACGCTGGCCTTAGCAGAGCACAATCACTAGTTAAAGTCCAAAGCCTTCAAAGTTCACCTAAAAGTCTGCACAAGTGTAGAACTAAACCACCAATTGTTGGAGGTGAAACGGTTAAAAACGGTAAGAGCACATCCCCGAGAACTTCACCAAAAAATTGTCCAAATACTCCCAAAAAAACCGCTACTCCTTTGCATAACAAAACTCTTGGATCCAAAGTCGAGAACCCCGCTACCGCAATGCTTGCTAGTTCTAACTCAAATAACTCCATCACACTGAAAGTAACGACAAACACATTGTCACAAAATGGCGGAACTAACACCAAAGTCTATGTTCAAAATTCACCTGTTCGTTCTGTAATTACTTTTGAAAACGGTAAAATTACTGAGACTAGTAACGGCAGCAACATATATATAATTAATGATGACAGACAAGTCGTGTCCGTCTCCCAAAATGGAGTGTCTAACCAAACGACAAAAAATCCGACAGAAACATCTTTTGATGTATGCGTTGAAAAGAAGAAACAGTTGTACCAAGAACCAGATAAAGAAAAAGTACAAGAAAATAAATTCAACAAAAATTCAATCAACGACACGCGAATGAATAACAACAGAAAATTATCTTTACAGATAGGAGGTGTTGCGAACAATAACAGTTTCATTTACAAAAATCAGTTAAACAATACAAATGACGTAGCCTCAAATCCTTCTTCGCCAGCAATCCATAACAACATTCATAATATAGAAGCGAGCGCTACCAGCAATCCTTCCACGCCAACTAAGACCTATGACAATGTCATTGGATCATTAGGCAATCTAAGATATCAGAAGAATTCTTTAACAACAACGCACGGAGGAATACATGCGAATTTAAACACAAATAGCGACCTTAAAAGCGTTGACTTGCTAAAAAAAGCAGCAGCTTTGCAAATGTTGAATGGGCTTCCAAATATTCATAATAGAATGAGCTCGGAATCTATAGCTAATCTATTATCGAAAGGAATCGATCAGAAACCGACAGTTCTGGGTTCTGAACCCAATCTGGCACTAAAAAACCAAGAAGTAAATAAAGATATAAACATTTCATCTGAAAAGATTCACAGCTTAGAAAACAAACAGAAGCGATACAGCCTAAGTCAAGATGGCAAGAAGGAACACCAAGATTTTTATAACTTTCCAAGCCTAAGCGACTTGAGCTTTAATTTTACTAGTTTAGCTGCACAAAAGATTTTGAAGGGGGTCAGTATAAATAGCGTAGATACGTTGGTAGAACTGAACATGGCCGCCAACAATACAGAGAAGCAAAACAATCGCGATGTAGCTGCAGTATGCACGGACTTCGGCCTTGTATAG

Protein sequence:

>DPOGS210055-PA
MQLARVGDIEDCIVTPTYQGQFTPLPEALCDCIMDLTTQGQSATLESIRTSLSSKFPSMQTPSQEVVYDTLAQLMQERKIYQTSRGFFIVTPERRRSRSRSSSRHHSTEDECSSPRTILMSDQEALHQLYGEITTVRDGAVTHQCVQTNLADVICGGNPNDKVLYGRPNKRRSASFPAPRSLDRRHSLRIFGSSSKYLQRCASTRSLHHKHNTTDSSSSTDYPPSVESASPKKVSLLSRLFRRSGRSKQTRAMSTFSAQFPPTEWFNSKAVHLHCVATQTDSKESLQSQTSIVSSYYDGSEISNRSSTLPRRHKRHLSTESGLATSMQYDHSPVRQSSPSSGSLPRSTLSRSSTNKTILDHFGSPQRNSEPKLRDSPNGSLRRVDYSDNLMSTSGPSSLESNTHRTPRKDYRNGQSDLNSPMKRGYHTSGSSGHSSLESHISDRTLKPSPSHTNGNAGLSRAQSLVKVQSLQSSPKSLHKCRTKPPIVGGETVKNGKSTSPRTSPKNCPNTPKKTATPLHNKTLGSKVENPATAMLASSNSNNSITLKVTTNTLSQNGGTNTKVYVQNSPVRSVITFENGKITETSNGSNIYIINDDRQVVSVSQNGVSNQTTKNPTETSFDVCVEKKKQLYQEPDKEKVQENKFNKNSINDTRMNNNRKLSLQIGGVANNNSFIYKNQLNNTNDVASNPSSPAIHNNIHNIEASATSNPSTPTKTYDNVIGSLGNLRYQKNSLTTTHGGIHANLNTNSDLKSVDLLKKAAALQMLNGLPNIHNRMSSESIANLLSKGIDQKPTVLGSEPNLALKNQEVNKDINISSEKIHSLENKQKRYSLSQDGKKEHQDFYNFPSLSDLSFNFTSLAAQKILKGVSINSVDTLVELNMAANNTEKQNNRDVAAVCTDFGLV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: