MonarchBase - Protein-coding gene

DPOGS206533
Transcript	DPOGS206533-TA	3468 bp
Protein	DPOGS206533-PA	1155 aa
Genomic position	DPSCF300190 - 235379-247967
RNAseq coverage	59x (Rank: top 68%)

Annotation
*Heliconius*	HMEL002291	0.0	73.90%
*Bombyx*	BGIBMGA005920-TA	2e-107	74.60%
*Drosophila*	Oseg4-PA	0.0	33.62%
EBI UniRef50	UniRef50_Q9W097	0.0	33.62%	LD29485p n=13 Tax=Diptera RepID=Q9W097_DROME
NCBI RefSeq	XP_001352755.2	0.0	33.54%	GA15220 [Drosophila pseudoobscura pseudoobscura]
NCBI nr blastp	gi\|195490544	0.0	34.08%	GE20921 [Drosophila yakuba]
NCBI nr blastx	gi\|149727746	3e-160	31.64%	PREDICTED: WD repeat-containing protein 35-like isoform 1 [Equus caballus]

Group
Gene Ontology	GO:0005515	3e-22	protein binding
KEGG pathway
InterPro domain	[214-320] IPR015943	3e-22	WD40/YVTN repeat-like-containing domain
	[86-533] IPR011047	1.2e-15	Quinonprotein alcohol dehydrogenase-like
Orthology group	MCL13592		Single-copy universal gene

Nucleotide sequence:

>DPOGS206533-TA
ATGTTTATATATATGAGTAAAAAGATTGCTATTCCAAAACAATCAAATGTTTCTTGCCTGGCATGGAATCATTCATCGGGATATATAGCTGTTGGAGGAGAGGATGGAATGCTAAAAGTTTTAAAATTAGAGTCAGGTGGAAGTGGTAACCTCTCTATGAATCTCAGCTTAGAAGGTCACACAGGAAGAGTTTGTTGTGCGATCTGGAATGAGGGATCATGGTATGAGGAAATGATAAATAACAGAAATAAGTCTACAGTATCAGGGATGGCATGGGGTTCTGATGGACAGAAAATTTGTATAGCTTATGAAGATGGTGCAGTAATTGTGGGTTCAGTAGATGGGTCACGAGTTTGGGGCAAGGATATAAAGGGTCCAGGTCTTAAAGCTGTCCAATGGTCCCCGGATAACTCATTACTACTTTTTGCCCTTTCTAATGGAGAACTTCATTTATATGATGATCAAGGAAATTTTATGATGCCAGTAGGAAATAATGAAGTGTCAGGATCAACTGATGTAATCTGTATGGACTGGTATTCCGGTAGAGCACCAGCCAATAGACCAGTTTTAGTTATATGTTACAAAAATGGACTGATGCTTCTTATGAAAAATATCATTGAAGAAGAGAGTGTAGTGGTTGATACAAACATGACAATAATAGACGGTCACTGGAATCACAATGGAACCATATTAGGTGTGGCCGGAAAAACACAAGATCAAGCCAATGTTGTACAGTTCTTTAGTGCTTATGGAGAGCATATCCGGTCGCTGCGCGTGTCCGGCGGCTGCATGCAGTCCCTCTGCTGGGAGCAGCGCTCACTCCGCCTGGCCGTCACTATAGACAGTTTCATATACTTCGCGAACGTCAAGCCGGACCACAAGTACGCCTTCTATGGGAACACGCTGGCATACGTCTCCGGAACTGATACTGTCACATTTTGGGATACTCTCACTCATCAGTCATGGGTAAACCACATTCCCGACGTAGTGGACATGTATGGCGTCGACGAGTACTGCATTATAGCAACTTTGACTGCCCTTATCATATCCAACCAACAAGGGATCCAGTGTGATGCCAAAGCAATTACTATGCCGATATCTTTTGTCACAATTAATAGCAAAGCGATAGCCGTTGCAGCCTCCAAAGAATCCTTCATGATATGGAAGTTTTCAATACCTTCAAGACCGCGTATAACTGAGCAAGTTTTCTATGCTGACGGTAGTCCTGTCACAAAGAGTGAGGCTGGCTTCCACGACGATACGATATGTTGTATCTCATGTTCAGACACACATTTACTTATAGGAAGAGATTCAGGCACGATTCTATTGTTCTCTATGTTGAACTTCAAGAAAATTACATCCATCAATATGAATACGAAACCTTACAAGCTTGGCCTTAACTCAAATTCAAGTAAATTTTTCGTAATCGACCAGCCTGGTTCCCTTTTCATTCTTGAGACGGAAATGGCACATAACGTCAGTGTTGGACAAGCGGTACGAAGGGAGGCGTGGGCCGCGCGCTGGGCTTCAGATAACTCATCCCTCTTGGCGCTGGCGGAGAAGAATCGTATATATGTACTGAGAGACGGCCAGCCCGAGGAACCTCTAACAGCTAACGGTTACCTCTGTGACTTCAAGGATCTAGAAATAACTTGCGCGCTGTTAGATAGCATAACGGACAAGTGTACGCCGCAGCATGTGGTCAGGATGGAAGTAAAGTCGTTGAGAGACACGAGACAGCTCATAGAGAAAGTGGGATTGAAAGAAGCCGAGGACTTCATCAAGGATAACCCTCATCCGAAGCTATGTAAATTTTTCGTAATCGACCAGCCTGGTTCCCTTTTCATTCTTGAGACGGAAATGGCACATAACGTCAGTGTTGGACAAGCGGTACGAAGGGAGGCGTGGGCCGCGCGCTGGGCTTCAGATAACTCATCCCTCTTGGCGCTGGCGGAGAAGAATCGTATATATGTACTGAGAGACGGCCAGCCCGAGGAACCTCTAACAGCTAACGGTTACCTCTGTGACTTCAAGGATTTAGAAATAACTTGCGCGCTGTTAGATAGCATAACGGACAAGTGTACGCCGCAGCATGTGGTCAGGATGGAAGTGAAGTCGTTGAGAGACACGAGACAGCTCATAGAGAAAGTGGGATTGAAAGAAGCCGAGGACTTCATCAAGGATAACCCTCATCCGAAGCTATGGTTACTATTAGCTGAGGCTGCATTGAAGAAGCTGGATACGTCGTCTTTGGAGACTGCGGAGGCTGCGTTCGTTAGACGAAACGACTACGCCGGGGTGAGAGCTGTCAGGCGACTCAACGGTCTACACTCCGCGGCTCTCAAGAAGGCGGACATACTGGCATACTTCAAAGACTTCGATGCCGCTGAACAGATATACCACGATGAAGACAGGCGTGATCTGGCTATCGCTTTACGAAAGCGTTTGGGACATTGGTTCCGTGTGGTGGAGCTCCTAAAGATGTCAGTCACAACGACGGAGGCTCAAGTTAAACAAGCTTACAGTAACATTGGCGATTATTATATTGACAGACAAAACTGGACAAGCGCTATTGAATATTACAATATGTCAAACAACATAGACGGCCTCAAGAAATGTTACATGGCGTTGGAAGACAATGAATCCCTGTCAAAACTAATATCAGGAAGCCCGAGACACGCTAAGGTGGAACGAGAAAATAGATCCGGCGTCGACAAAAAAATAGACAGCATTCAAGAGCCTTCCATACAAGCTATAGCGCAGTTAAAAGAATCCGGACGCACACTGCAGGCAGCGGCTATGGCGTTTCAAATGGCGAATGCGGAAGCGGCTAAAGCGACTTCACCGTTGCGGATCAAGAAGCTATATGTCCTAGCGGGACATCTGTACAGTCAACACGCAGTCGACGGTGGTAAGAGTCGTGAGGCTGGTTCGTGCTGGCGTGCAGCTCGAGCACAGCACTGGTTCTGTGCCGCGGCGTCGGCTGCGGGGGGCGGAGGACCCGCTGCCCTCCGCCTCGCCGCCCGTCTGATGGACGTCCTGCCAGCACTACACGAGACACAGCACTTACAGGCCAGTACAGTGTCTTTACTAACATTCTCCGCCTGGTGTACAATTGCAGCCATAGCACTACAAGCGAGGGCTTTCGACCTTTGCTCAAAAGCGTTGATAAAGCTTGAAGCATTAGACGTAGAGGTATTCGAGACAATCGCCATTGAAATATTCAGCAGATGTAAACCGAAGGATGCCAAGTCCAACAAAATAGAATGCCCTCATTGTCAGATGAATATACCGGATTGGGTGTCATCGTGTCCTGGATGTTCGAGCTCGTTCCCGGGTTGCGTCGTATCTGGTCGCCCATTGATATCTCACACCACGTGGTCGTGTAATCGGTGTGAATCTCAAGCCCAACAACACGAGCTCGTCCTGCGACACGCCTGCCCAATGTGTCACACTCAACTCGCATAA

Protein sequence:

>DPOGS206533-PA
MFIYMSKKIAIPKQSNVSCLAWNHSSGYIAVGGEDGMLKVLKLESGGSGNLSMNLSLEGHTGRVCCAIWNEGSWYEEMINNRNKSTVSGMAWGSDGQKICIAYEDGAVIVGSVDGSRVWGKDIKGPGLKAVQWSPDNSLLLFALSNGELHLYDDQGNFMMPVGNNEVSGSTDVICMDWYSGRAPANRPVLVICYKNGLMLLMKNIIEEESVVVDTNMTIIDGHWNHNGTILGVAGKTQDQANVVQFFSAYGEHIRSLRVSGGCMQSLCWEQRSLRLAVTIDSFIYFANVKPDHKYAFYGNTLAYVSGTDTVTFWDTLTHQSWVNHIPDVVDMYGVDEYCIIATLTALIISNQQGIQCDAKAITMPISFVTINSKAIAVAASKESFMIWKFSIPSRPRITEQVFYADGSPVTKSEAGFHDDTICCISCSDTHLLIGRDSGTILLFSMLNFKKITSINMNTKPYKLGLNSNSSKFFVIDQPGSLFILETEMAHNVSVGQAVRREAWAARWASDNSSLLALAEKNRIYVLRDGQPEEPLTANGYLCDFKDLEITCALLDSITDKCTPQHVVRMEVKSLRDTRQLIEKVGLKEAEDFIKDNPHPKLCKFFVIDQPGSLFILETEMAHNVSVGQAVRREAWAARWASDNSSLLALAEKNRIYVLRDGQPEEPLTANGYLCDFKDLEITCALLDSITDKCTPQHVVRMEVKSLRDTRQLIEKVGLKEAEDFIKDNPHPKLWLLLAEAALKKLDTSSLETAEAAFVRRNDYAGVRAVRRLNGLHSAALKKADILAYFKDFDAAEQIYHDEDRRDLAIALRKRLGHWFRVVELLKMSVTTTEAQVKQAYSNIGDYYIDRQNWTSAIEYYNMSNNIDGLKKCYMALEDNESLSKLISGSPRHAKVERENRSGVDKKIDSIQEPSIQAIAQLKESGRTLQAAAMAFQMANAEAAKATSPLRIKKLYVLAGHLYSQHAVDGGKSREAGSCWRAARAQHWFCAAASAAGGGGPAALRLAARLMDVLPALHETQHLQASTVSLLTFSAWCTIAAIALQARAFDLCSKALIKLEALDVEVFETIAIEIFSRCKPKDAKSNKIECPHCQMNIPDWVSSCPGCSSSFPGCVVSGRPLISHTTWSCNRCESQAQQHELVLRHACPMCHTQLA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: