MonarchBase - Protein-coding gene

DPOGS209449
Transcript	DPOGS209449-TA	3204 bp
Protein	DPOGS209449-PA	1067 aa
Genomic position	DPSCF300275 - 134600-140806
RNAseq coverage	36x (Rank: top 74%)

Annotation
*Heliconius*	HMEL002598	0.0	72.79%
*Bombyx*	BGIBMGA005866-TA	0.0	76.28%
*Drosophila*	CG40583-PB	2e-63	36.91%
EBI UniRef50	UniRef50_D6X348	0.0	41.88%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6X348_TRICA
NCBI RefSeq	XP_970543.1	0.0	41.88%	PREDICTED: similar to CG40583 CG40583-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91090532	0.0	41.88%	PREDICTED: similar to CG40583 CG40583-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91090532	0.0	41.28%	PREDICTED: similar to CG40583 CG40583-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	7.2e-33	protein binding
	GO:0003824	5.2e-16	catalytic activity
KEGG pathway
InterPro domain	[128-687] IPR011047	3.7e-36	Quinonprotein alcohol dehydrogenase-like
	[484-606] IPR015943	7.2e-33	WD40/YVTN repeat-like-containing domain
	[540-936] IPR011041	5.2e-16	Soluble quinoprotein glucose/sorbosone dehydrogenase
	[383-440] IPR021717	1.9e-06	Nucleoporin Nup120/160
Orthology group	MCL15017		Single-copy universal gene

Nucleotide sequence:

>DPOGS209449-TA
ATGGCAAACGATTGCGAAGTTAAGTCTATTATGTCTATATCATCTAAATCGGAAGGAAGCACGGCTCCGCTATCTCGCATTCGGTGGCGAAATGCTCCTCTTCACGAGAGATGCAGCATGGCTGACATGGTCAAGATTAAAGAAGCGTTCCAGGCAGCTTATAGAAATAAAATGCTACCAACAGAATTTAGAAATCTCTTGAGGACATTGTTGAATGTTGAATATGATGATGACGAATTTAATATACTTTTTATGAAGATAAATACGGCTCGCAACGGAGAGATCGATTGGGACGAGCTCGTGTCGCATCTACTTCTGGGCTATTTCGGCAATGACCCTGAGAACCAGAGAGCCTCCCTCCAGCTGCCGATTATGGGACTGCCGACTGTTATGAGATCACAGCATCGGCACCCGATATCGAGAATATGTTTCTGTCCTGACGACCGGAGCACGGATCCCATGCAGGGCAACTACATAACGGCGAGTCGCGATGGAATGATTAACTGGTGGTCCCTGGACATGTCGCTGTTGAGGACCGCCTTCTCTTCCAGTCCTCACCTGAAAGTGCGCACGACCTGGGTGACGGACATGGTCTGTATGCCGGACGTCAACATTATTGTGACGAGTTCTACCGAACGAGACCTGCGCTTCTATGACTGTACGGCGAAGACTTTCACCCTTAAGATCGTCATCACGAGCTGGGAGTACATGATCTGCTCCATGTACTACCACTTCTACAAGGACCCGAACGAGCGATGTATCCTGATCCTGGGCGACGTCGGTGGTCACGTGCGCGTGCTCACCTTCTCTCCCATAAAGCGCGGTCCCTTCCGCAACCAGCCCGGCCGGGCGCTGCAGCAACTGCGCCACGTCGACCTCCAGCGACGGCCCCACTTGTTGCCGGAGCTGAGGTTGACGGAGAAGGGTCGCGTCCACGGCGAGTGGGTCCGTCAGGTGTCGTTCTATTCGTCCCTGCACTGCATCGTGTCGTGTGCGACTTGCCCGGACTCTCTGCTCATGTGCGACCTCGCCGGTTCCAAGACCTATAACATGTTTCACGTCGAGAAGGGTATTCAGTGTTTCACATTCGACGAGGAGGCCCACATCCTGGCGACGGGAGGCCCGGACTGCACGGTCCGCGTGTGGAGTCCGTTCGTGCCGCGCGCCGCGAGCGTGTCGCTGACGGGGCACCACGCCGCCGTCACCGCGCTCGTGCTACAGATCTCCGCCACGACCTTGCTGTACTCGCTCTCCAGAGACCGCGTCATCAAGGTTTGGGACGTGCAGGGACAGGTGTGCCTTCAGACATATATAGACATCCCTCCGCAAGTTGGCGAGCGCACACCCATCTCCGCTCTATATAACCCGGTGACTCGCGAGTTCATAGTGGGAGCTATAAAGATCGCCGTGGTGGTCCTGGACGAACAGCTGAACCCCCTCCACACGGACGGGTTCACGCACTCGCGGGCCGTGTCCAAGATCCTCTACAATCCGCTGTTCAAGGTGGTCATCACGTGCGGCCTGGACAGCATCATCATCAACTGGGATCCGGTGACCGGTAAGCGCAACGCCATGGTCCGCGACGCCCACACCCGCCTGCTGCACGGCGAGTCCATCCCAGTGGAGATCACGGCCGCCTGCTTCGACCCCGGCTACCAGCTGCTGCTCACCGGCGCCAGGAACGGGACACTCAAGGTGTGGAACTTCAACACGGGGATATGCTTGAGGAGTATGGCCATAGAACACATGTGCGAAGTCACGAGCTGTTTTTGGGTCGAGGGGAGGATTCTAGCGGTGGGATGGAACCGACACGTCATAGAGTTCGAGGACGCGGGGGGGTCGGGAGGGTCCGGGGGGTCGGGAGCGGTGGAGGGGGGCGGAAAGGCCTGGGAGACCAGGCACAGCGACGACGTGCTGACGGCCGCCGCCCGTCCCCCGCTCACTCTCGCCACCGCCTCCTACAACTCAGAACTCATTCTGTGGAAGCTCGAGACGGGACAGCCTTACAGGCGATTCTCATGCACCGAGCCGATGCTGCGCATCAAGATGCAATACAGCAAGCGAGCTGCCTCGCCCCAGACGGCCTCCGCGACCTCGACCCGGCGGAGCACCTCCACCGTGAGGCGGCCGAGGTGGTCATCAGGTGTCTTTGGTTCATACGTGGGCGGTCAGCGGGAGTCCCTCATCGACTCGACCGCCGCCATGCAGAAGGCGCGAGCTCGGCGCGTGTCCACGGTGTCTCTGCCGGCGCGGGCGCAGAAGATGCGGCAGCTCGCCGTCCACGCCACCATATTCCTCACCACGCGACCCTGCCACATGCGCCCTCCGTCGCTCATGGTGGCTCTGGAGAACGGCCAGGTGCAGTGCTGGTCGGACCACCCGGCCGGCGGCCTGCAGGGCTCGTTCCAGGGCATCCACACGGCGGGCGACTACGTCTCCGCCTTCGCCACCGACGTGGCCAACGACTACCTCTTCGCCGGGACCACGGTCGGCTACATCAAGATCTGGCTCATGACCAACTACCTCACCAACGAGGAGGTTCACGTTAACATGCCGAAGCTGCGGCTGACGTTCCCGTTCCTGTGGCGGGACCGTATCGAGGGACGCGCCAAGCGCTGCGTGCGCGACCAGCCGCTGCCCCTGCTGCTGAGCAGCGTGCGCGCCCACCTGCGCTGCATCACGGCGCTCGCCTACATCGACGACCTCCGCCTCGTCCTCAGCGGTTCTTCGGATTACAGCGTGAGAGTGTGGAAGCTGTCCGGGGAGTACCTGCAGACGTTGGGTAGCTTCTTGCCGTGGACGTTGGAGGTCACTCGTTTTCCTCCCGACGTCAAGAAAGTCGCCAGCTTTACAACGTTCAAGGTGTGGCGCGGCGGATGGGTCTCCCGCTACACCCCGGGCCAGGTGGAGGTGGACCTTCTCCGCGACATCACCTCGCACGAGCTCGCCACCCGCACGTTCGGCGCTCCGGCCCCCGCGCCCCTGCTGGGTCACCACCTCGCCCTCCCCCGTAAACCTGACACTCAGCCGCCGCCGGGACTCGACGACTCGCTGCCCACGATCCCGCTGTACACCCACCTCCGCATGTCGTCGACGCAGCCCGTCCGCCGCATGGCGACTCCGCCCCTGGCGCGCGCCACTCGCCTCCGCCGCGCCGCCGCCGCCCGCGCGCCCAAGACTCACTTCCACGGCGACAAGTCATGA

Protein sequence:

>DPOGS209449-PA
MANDCEVKSIMSISSKSEGSTAPLSRIRWRNAPLHERCSMADMVKIKEAFQAAYRNKMLPTEFRNLLRTLLNVEYDDDEFNILFMKINTARNGEIDWDELVSHLLLGYFGNDPENQRASLQLPIMGLPTVMRSQHRHPISRICFCPDDRSTDPMQGNYITASRDGMINWWSLDMSLLRTAFSSSPHLKVRTTWVTDMVCMPDVNIIVTSSTERDLRFYDCTAKTFTLKIVITSWEYMICSMYYHFYKDPNERCILILGDVGGHVRVLTFSPIKRGPFRNQPGRALQQLRHVDLQRRPHLLPELRLTEKGRVHGEWVRQVSFYSSLHCIVSCATCPDSLLMCDLAGSKTYNMFHVEKGIQCFTFDEEAHILATGGPDCTVRVWSPFVPRAASVSLTGHHAAVTALVLQISATTLLYSLSRDRVIKVWDVQGQVCLQTYIDIPPQVGERTPISALYNPVTREFIVGAIKIAVVVLDEQLNPLHTDGFTHSRAVSKILYNPLFKVVITCGLDSIIINWDPVTGKRNAMVRDAHTRLLHGESIPVEITAACFDPGYQLLLTGARNGTLKVWNFNTGICLRSMAIEHMCEVTSCFWVEGRILAVGWNRHVIEFEDAGGSGGSGGSGAVEGGGKAWETRHSDDVLTAAARPPLTLATASYNSELILWKLETGQPYRRFSCTEPMLRIKMQYSKRAASPQTASATSTRRSTSTVRRPRWSSGVFGSYVGGQRESLIDSTAAMQKARARRVSTVSLPARAQKMRQLAVHATIFLTTRPCHMRPPSLMVALENGQVQCWSDHPAGGLQGSFQGIHTAGDYVSAFATDVANDYLFAGTTVGYIKIWLMTNYLTNEEVHVNMPKLRLTFPFLWRDRIEGRAKRCVRDQPLPLLLSSVRAHLRCITALAYIDDLRLVLSGSSDYSVRVWKLSGEYLQTLGSFLPWTLEVTRFPPDVKKVASFTTFKVWRGGWVSRYTPGQVEVDLLRDITSHELATRTFGAPAPAPLLGHHLALPRKPDTQPPPGLDDSLPTIPLYTHLRMSSTQPVRRMATPPLARATRLRRAAAARAPKTHFHGDKS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: