MonarchBase - Protein-coding gene

DPOGS202910
Transcript	DPOGS202910-TA	4932 bp
Protein	DPOGS202910-PA	1643 aa
Genomic position	DPSCF300126 + 273131-291790
RNAseq coverage	271x (Rank: top 40%)

Annotation
*Heliconius*	HMEL011781	6e-171	43.39%
*Bombyx*	BGIBMGA004187-TA	7e-157	60.53%
*Drosophila*	CG1718-PB	1e-161	27.08%
EBI UniRef50	UniRef50_UPI0000D566CF	1e-175	28.51%	UPI0000D566CF related cluster n=1 Tax=unknown RepID=UPI0000D566CF
NCBI RefSeq	XP_969271.1	2e-176	28.51%	PREDICTED: similar to ATP-binding cassette sub-family A member 3 [Tribolium castaneum]
NCBI nr blastp	gi\|91085607	4e-175	28.51%	PREDICTED: similar to ATP-binding cassette sub-family A member 3 [Tribolium castaneum]
NCBI nr blastx	gi\|157133279	2e-174	27.98%	ATP-binding cassette sub-family A member 3, putative [Aedes aegypti]

Group
Gene Ontology	GO:0005524	1.9e-20	ATP binding
	GO:0016887	1.9e-20	ATPase activity
	GO:0000166	7.8e-09	nucleotide binding
	GO:0017111	7.8e-09	nucleoside-triphosphatase activity
KEGG pathway	rno:302973	3e-163
	K05643 (ABCA3)	maps->	ABC transporters
InterPro domain	[528-648] IPR003439	1.9e-20	ABC transporter-like
	[513-704] IPR003593	7.8e-09	ATPase, AAA+ type, core
Orthology group	MCL17647		Insect specific

Nucleotide sequence:

>DPOGS202910-TA
ATGAATACGTTAGGAGTTCTTATGTGGAAACATATGGTGGTTAGGAAGAGAAGATTCATCCACACTACAGTTGACATATTATCTCCTTTAGCATTCTTTGTGCTCCTGTATTTATTTAAGGGATATATAACCTCTGGTAGGAGATCTGCGATGTCTGATGAGTTTATAGTCCAAAATACTGAACCAGTGGATTTAGACAAGTTGCAAGGGCCCACAGCTGTATTCTACAGCCCTGACACAGATCTCACTGGCCTCCTCATGGACCAGGTCGGTGAAAGCTTACACTTGCAGAGGAAGAAATACACTCCAGGTTATCTTGAGGAGTTTGGATACATGCCCTTCCAAAATCTATCTGATATACTTGATGCTAATAGGAAGCTAACAGATACAGATGCCATAGTATTGTTTGAAAACATGAACAGCACGTGGCCTGAACGACTAAACTATACCATCAGGATGAAAGGTGACTTCCAGACGAACAAAGTGACCGTCAACGACGAGTCCTTGGGGCCACACGAGAGCTTCGGTACGATATATGAGCCCTTCATGAGACTGCAGTGGGCCATAGACACCAGCTACCTCAAACTGTTATCCGGCTCCGACATCAAACAGCGTGTGACGATCCAAGAGTTTCCTTACGTCCGCCAGCAAGAAGTGCCAGCAATAAAGAACGTCTGCAACCTTCTGCCCTTCATCTGCTGGATATCCTTACTGCTGACATTCGTGTATGTAATGTCGAAGCTTCTGGAAGAAAGGATCACTGGTATTCAGGAGCTGATCAAAATGGCGGGAGTGTCAAACTTCCAGATATACCTGTCCCATTTCCTAAATATGTTGCCTGTCGGCGTGATTTTCTGTGTTTTTGGGACCCTCGTTATGACACTGACCGCCACTCCCATCATACCACAAACCAGCGCCTTTCTCATCATGATATTCTTGATTTTGCACTTTATGAACGTGATGTGTATGGCGTATTGTAGCAATTTCCTCATCACCAACACTCAGTACTCGACGTCAGTGGCGGCTGTGGTGTACATCGTCGCGGAACTTCCAATAAGCTTAATTGGAAAAAGCTATCCTACCTGGGCGCGGCCGATCGTAGGATTGTTACCCTTTATGCCCTTGCACTGGTTCTGGTGGGAGGTCGGCGAGATGGAAGCGTACGGGAAGGGCGCTGGATTCGGATCTATTGCGACGATCCACGACGCTGGATCTGGTAGTATCTTGGCCGCCTTCGCCTTCTTGCTGGTACAATCAGTGATTTTCCTCTTACTGGGCTGGTACCTGTCACTCATCAACCCTGGACCTTACGGACAACCGCTGCCCATTAACTTCCTCTGTAGCTCGAGTTTTTGGACTAAGAAGCAAGTTGTCCCTGAGGAGACGATCGAGGAGGAAACTGAACTCGCAGAAAGGCAGGACCCCGCGTACTTTGAAACTCCGCCCAAGGACATGTATCCCGGGATTAGAATCGTGAACGTGTCCAAGGTGTTCCCTAAACACCGCGCACTGAATAAAGTATCCTTGGACGTGTACCGCGGAGAGATCACAGTACTGCTGGGACACAACGGAGCCGGGAAGACTACGCTGATGTCAATAATAACGGGAATGATGAATGCGACTGAGGGTAAGGTATACGTGGAGGGGTACGACACGACCACCCAGAAGAGCCAGATGAGAAAGCTGCTGGGTCTGTGTCCACAACACAACCTGTTCTTCCCGGACCTCACCATACAGGAGCACGTGATTTTCTTCACCATGCTCAAGGGGAGCTCGTATCAAGAGGCGGGCCAGTCATCGGCGAAGCTGCTGCAACAGCTGGGGCTGGGAGACAAGATGTCGGCGAACAGCAGCGACCTGTCCGGGGGCATGAAACGTCGTTTGCAGCTGGCTTGCTCATTGGCGGGAGAAGCGGCTGTACTGATCCTGGACGAACCGACTTCTGGACTGGACGTGGAAACTCGCAGGGAACTCTGGGATCTGCTGTTGTCGCTCCGCGGCTCCCGCACAGTCCTGCTGTCGACTCACTTCATGGAGGAGGCGGATGCTCTCGGCGACCGCGTGGCAGCGCTGCACTCCGGCAGGCTGGTGTGCCACGCCACCACCATGCACCTCAAGAAGGCTATCGGGACCGGCTACCGTCTGTCGTGCATCACCGTGGGCGTCCCTAACGAGCCCGCCATCACCTCCCTCATCACGTCCTACGTGCCGGACGCGACCCTCAAAGAGCAGACCCTCAATTCCCTCTCGTACAACCTCCCATCGAAGGACACCAGCAAATTCCCAAAACTCTTCAACAGCTTAGAATCAAAAAAATCCGAATTGGGAATCAACTCTATCGGAGTCGGCATTTCGACGCTGGAGGAAGTGTTCTTGAAACTATGTAGCGACACAAGCGCTGGACTGACGCTCGACGAGGTGGACACGGGACCCAGTGAACCCCAGTACGAGGTCCTCACGGGTATGAACCTGTGCGCGCGCCAGTTCGTGGCGCTGGTGAGGAGACAGCTGAAATATTTAAACGCGAGGAGATCGATTTTTTTGACTGTGAGTGTACTGCTGCCGATCAGCATGATGTTACTAATGACCTTCGCATTGAACACCGACAAGGCAAAGGAACAGAGCGACGACAGCGTGGCCCTGGACCTGGACCTGTACACGCAGCCGCACAGGAGGGTCATGGTGAACGTGGAACCCGGAACCAACGTCAGGGCCCTCGGAGACTCCTACCCCACCGTGGACTTTGAACTCACCAGCGACGTGGCCGACGCGATCTTCCGAACCAGCAAGAAGGATGTGTTTGAATACAACAAATACCTGGTCGGCATCGAACTGAACGAGACGCACGCCAATGCGCTATACACGACGGTGGTGCGTCACGCGGCGCCCGTGTCCTTGAGCATGTTGTCCAACACCCTGGCGACCCTGCTGCTGCCGGCGGCGGACGGGCGGGTGCTCTCCACCCACAACGACCCTCTCCAGGAACGGAATTCCCAGCGCCTGATCCAGCCCAAGTCATCCACACACGCGATGCTGTGGGGTATCGTGATCTGCATCACCGTCTTGACCACCGCGGCCAACTACATGTCTCTGGCGTGCAACGAGCGGGCGTCGGGCACCCGTCACCTGCACGTGCTGTCCGGCTGCTCGGTGGAGATCCACTGGGCCGCGACTCTGTTGTGTCACCTGGTGCTGTGTATCGTCACCCTGGCCCTGCCCGCCAGCATCGCCCCGCTGCTCGACGAGGACAGCACCATCGACGCTCCGGAATTCATGGGCGCCGCGTTCGTCCTGTTGGTGTGCGCGTTGCTGTCGTTCCTATCCTTCACGTACTTCCTGAGCCTGTTCTTCAAAGAGAGCACCGCGGGGATCGTCGCGATGATCTGCCTTATACTATTCGGTTTCTTCACGCCGACTCTGAAGACGGCCACGGAGGCGGTGCAGCAGAATCTAGACAGCTTCTGGGACTACCTGGTGCTGTTGGTGAGCTACACCATGCCACCGCACACTTGCGTGCGCGGGTTCATCAAGGCCACGGACGACGCCTGCGTCAACGCCATGTGCAAGCTGAACAGACCAGACGGCTGCAAGCTGGAAGGACACCTCACCGGAGCCGACCTCGACAAATGCTGCGTACAAAACATAAACCCGAGATGTTACATGTGCTTCGACAAACACGCGCCCATGGCTGAGTGTGCCGTCCTGCTGGGGCAGTTCGTGTTCTACATGGCCTTGGTGATTATATGTGAGAACGGTATCCCGAATAAATTGAAAGAGATGATATTCAACTCTTCGTACAGACCCACCAGCACCTCCGCCACGACCATGGTGTCCGCTGAGAAACAGTACGCTGATGAGGCGATAGCACTGCCTCCCCGGGATATTCCTGACGCGGTGTTGGTCAGCAACATCTACAAGAGATACTTCTCTGTCCTGTGCAAGCCGTTCGTAGCCGTCAAGGGACTCAGCTTTTCGGTTAAGAGAGGCGAATGTTTCGGTCTACTCGGCGTGAACGGGGCGGGCAAGTCCACCACCTTCAAGATGCTGGCCGGCCTCGAGTACCCCTCCAAAGGATCCATCTTCGCCAACGGACAGTTCATGAGCCGCTCGAGCAGCAAGTACCTCCACTCTCTGGGCTACTGTCCCCAGTTCTTCGGTCTGGACTCGTTCCTGTCGGGTCACGATAACCTGGCTTTACTGCTAACCCTCAAGGGACTCAGCCAGGACGACGTGGAAAGAGAAGTTGACACGTGGATCAGGATCGTGGGTCTCGAGCGCTACGCCCTCCAGGCCGTGTCGGGGTACTCCGGGGGCTGTGCCCGCCGTCTGTCCGCGGCGGCGTCGCTGTGCCCGGGAGCTCCGGTGGCGCTGCTGGACGAGCCCACGGCCGGCGTGGACGTAGCGGCCAGGAGACGAGTGTGGACCGCGCTCAGGAGGGCCGCGCCTAACAGAGCCATCATCATCACCTCGCATAGCATGGACGAGATGGAGGCGCTGTGCAGCCGCATCGGCATAATGGTGGCCGGTCGCCTGAGGGCGCTGGGCTCGGCCGCGGAGCTGCGCGCGACACACGCCTCGGGACACGCCGTGCGCCTCAAGCTGTCGTCCCCCCTCACGGACGCTGACGTACATATAACGCTGGCGTTGTCCCGACCCGCAGAGACCGACAGCACCGTGTCGGACATCGCGCGACTCAAGGCGACGCTCCACGACATGTTCGAGTGCACGCTGAGGGACGAGCACAAGACGATGCTGCACTATCACATAAACGAAACTCTACGATACAGCCAGCTGTTCACTCAGCTGGAGCAGCTCAAGAGGGACTTCCCCTCCCTGGTGGAGGACTACGACATCACGGAGACAACGCTCGAGGAAGTGTTCCTCACACTGGCTCGGGAACAGGAGGAGGAGGCGTATGAAGCGAGAGTCTAG

Protein sequence:

>DPOGS202910-PA
MNTLGVLMWKHMVVRKRRFIHTTVDILSPLAFFVLLYLFKGYITSGRRSAMSDEFIVQNTEPVDLDKLQGPTAVFYSPDTDLTGLLMDQVGESLHLQRKKYTPGYLEEFGYMPFQNLSDILDANRKLTDTDAIVLFENMNSTWPERLNYTIRMKGDFQTNKVTVNDESLGPHESFGTIYEPFMRLQWAIDTSYLKLLSGSDIKQRVTIQEFPYVRQQEVPAIKNVCNLLPFICWISLLLTFVYVMSKLLEERITGIQELIKMAGVSNFQIYLSHFLNMLPVGVIFCVFGTLVMTLTATPIIPQTSAFLIMIFLILHFMNVMCMAYCSNFLITNTQYSTSVAAVVYIVAELPISLIGKSYPTWARPIVGLLPFMPLHWFWWEVGEMEAYGKGAGFGSIATIHDAGSGSILAAFAFLLVQSVIFLLLGWYLSLINPGPYGQPLPINFLCSSSFWTKKQVVPEETIEEETELAERQDPAYFETPPKDMYPGIRIVNVSKVFPKHRALNKVSLDVYRGEITVLLGHNGAGKTTLMSIITGMMNATEGKVYVEGYDTTTQKSQMRKLLGLCPQHNLFFPDLTIQEHVIFFTMLKGSSYQEAGQSSAKLLQQLGLGDKMSANSSDLSGGMKRRLQLACSLAGEAAVLILDEPTSGLDVETRRELWDLLLSLRGSRTVLLSTHFMEEADALGDRVAALHSGRLVCHATTMHLKKAIGTGYRLSCITVGVPNEPAITSLITSYVPDATLKEQTLNSLSYNLPSKDTSKFPKLFNSLESKKSELGINSIGVGISTLEEVFLKLCSDTSAGLTLDEVDTGPSEPQYEVLTGMNLCARQFVALVRRQLKYLNARRSIFLTVSVLLPISMMLLMTFALNTDKAKEQSDDSVALDLDLYTQPHRRVMVNVEPGTNVRALGDSYPTVDFELTSDVADAIFRTSKKDVFEYNKYLVGIELNETHANALYTTVVRHAAPVSLSMLSNTLATLLLPAADGRVLSTHNDPLQERNSQRLIQPKSSTHAMLWGIVICITVLTTAANYMSLACNERASGTRHLHVLSGCSVEIHWAATLLCHLVLCIVTLALPASIAPLLDEDSTIDAPEFMGAAFVLLVCALLSFLSFTYFLSLFFKESTAGIVAMICLILFGFFTPTLKTATEAVQQNLDSFWDYLVLLVSYTMPPHTCVRGFIKATDDACVNAMCKLNRPDGCKLEGHLTGADLDKCCVQNINPRCYMCFDKHAPMAECAVLLGQFVFYMALVIICENGIPNKLKEMIFNSSYRPTSTSATTMVSAEKQYADEAIALPPRDIPDAVLVSNIYKRYFSVLCKPFVAVKGLSFSVKRGECFGLLGVNGAGKSTTFKMLAGLEYPSKGSIFANGQFMSRSSSKYLHSLGYCPQFFGLDSFLSGHDNLALLLTLKGLSQDDVEREVDTWIRIVGLERYALQAVSGYSGGCARRLSAAASLCPGAPVALLDEPTAGVDVAARRRVWTALRRAAPNRAIIITSHSMDEMEALCSRIGIMVAGRLRALGSAAELRATHASGHAVRLKLSSPLTDADVHITLALSRPAETDSTVSDIARLKATLHDMFECTLRDEHKTMLHYHINETLRYSQLFTQLEQLKRDFPSLVEDYDITETTLEEVFLTLAREQEEEAYEARV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: