MonarchBase - Protein-coding gene

DPOGS205047
Transcript	DPOGS205047-TA	2043 bp
Protein	DPOGS205047-PA	680 aa
Genomic position	DPSCF300074 - 586480-592127
RNAseq coverage	579x (Rank: top 22%)

Annotation
*Heliconius*	HMEL015612	7e-72	58.60%
*Bombyx*	BGIBMGA006925-TA	0.0	75.88%
*Drosophila*	milt-PD	8e-72	35.23%
EBI UniRef50	UniRef50_E2BK45	6e-90	36.87%	Selenide, water dikinase n=7 Tax=Formicidae RepID=E2BK45_HARSA
NCBI RefSeq	XP_393589.2	5e-93	38.03%	PREDICTED: similar to milton CG13777-PA, isoform A, partial [Apis mellifera]
NCBI nr blastp	gi\|307186120	3e-95	36.60%	Selenide, water dikinase [Camponotus floridanus]
NCBI nr blastx	gi\|307186120	6e-103	37.41%	Selenide, water dikinase [Camponotus floridanus]

Group
KEGG pathway
InterPro domain	[25-176] IPR006933	5.4e-18	HAP1, N-terminal
	[271-364] IPR022154	7.7e-10	Trafficking kinesin-binding protein domain
Orthology group	MCL11418		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205047-TA
ATGGAACATCAGAACTTACGTGAAGTTAACTATATAATATTAACAAACGACACAGAGGATGGTTCGCCAACAGCTGAAGAGCAAGAGGCGGCTACTGCGATCGCTCTGAAGAAACGCACAGGCGCCCTGGAGAGGGAGAACAGGGCGCTCAGGGATGAGGCGGCGCGCCTCGCAGCCGGAGCTGACAGCGCCGAGCTCGCTGAGAGACAACTCCTCAGGGACATCGCCTCACAGCTTTCCAGTGCTAACTCTGAAGCATCGGTGTTAAGTTCGGAGTTAGCTGAAGAACGCCAACGTTCCACTGATCTCCAGCATCAATTGGATTCAACCAGCGCAAGGCTCGCGCTCAGTGAACGAAGCTTACAACAGTTGACCGTAGAACACGAGCACACTATACGAATATTGGAAATCACAAAAGATAATCAAAATGCGCTCGCATCAGAATTGGCAGACGCTAAGGAGCGGTATGCAGAGGTGGCAGCACTCTTGGCGGAGGCACAGGAGCAGCTCCGCGCGGTCCGTCGTCGCGGTGAGAGCACCCGCGGCCTCATGCCCTCCGTGGCCGCCGCTGCCGGTCTCCTACCAGCCAGCCTACATCGTGAGATGCATTCCTCCGTGTACTCCGAGCTCAGTCTCGACTCGGGTATCGGAGACCCGCTCGCACATTCAAGCATGCAGAAGGTGTTTGAAACGGTGCAGTGTGCATCTCGCTGGTCGGGTGCTTCACTGTCTGGCTCCGAGGACGATGTCGCTCCCCGCGTCTTCAAGCCGGTTCCTAAAACCACCTCCGACTCCTTCTTTGAAGATACATCGGACACCGAGTCTGAGGATTTGTACCCCGGTAACGCAGCAGTCGGCGTTCCTGGAGCACCGGGTGCCGCGGAGCTAGCAGCGGCCCTGAGACGTCTCACTCCACAAGAGATCAATTCGCGGCGCGCTTCACTAGCGGCGTCGCATTTGCTACATCAACGACGACGATCTGATAGGGATGCCAGTGAAGAGAGTGCGGTATGGGGAGCAGGTGCGGCAGGCGGGATCGCGAGGTTCCGCGCTCCTCATAAGTTACAGATCGTTAAGCCTATGGAAGGCTCCCTTACGCTGCACACTTGGGCTCAGCTCGCTAAGCCTAATATGTCTGGCTTATTAGAAGAGCAAGAAGGTGTTGGTGTGAGGGGCTCACGATCTGCACAATCGTTAGGCATGAGGGTATACAGGTTATCGGATGTAGAAGAAGATGATGACATGCCGCGGCTACCACACTCCAGTCATATATACACATATACGAACAGCACGGTCTTACATCCGAACGATGGCAGCCTCGTAGGTAGCAGCGTGAGCAGCGTGTGTAGCAGCGGTATGAGCAGTCTATCCAGCAGTGTGTTGGGCAGCGCCTGGAGTTCGCGCCTCACATCACGCCGGTCTTCCGCCGCGGTGTCACCGGTTCACTCTCGCCGAGAGTCGCTATGCGTTCCAGTCCAGCGCTCACACTTCACACCGACGGCCACACCCGCTAACAGCCCCCTGTTAGGCTCGCCGGATTCTTCACCTCCTCCCACACCGCGGCCTGGGGACGCCCCGCCCTCCCTGCATGCTTTGATAGCGAGCGGTACATCAATCCTTCGGCGGCGATACCTAACTTCTCCGAACTCCGACGGTTCACCGGCCCCGCTCGCTCTGCAAACCCCGGGTTCTCTTTATATGGGTCTCGTCCATCGCAGTCCGATGGAACAGCTGACGTGCCTGAAGAGAACGCTTCGATCGCCCGCTGCCGCGCCCTCCGAACGGTCGGATGACGCGGATGCTCCACTGGGGGTGCCCGCTCACCCGGGTGAGGGAGCCCTAGACGTGGCTGCCTCGATGGGGTTGGGATGCGTGACGGGGCCTTCAAACGGAGCGCGGAGGCCACGAGTAAGAGCACCTCGACCCCGTACCGACTTGGGCACGGTGGGAACGGCGCCCGCCGCTAATAATGTACCAGCGCATTCATCTCCCCTGGGCACTCTCAGCACTTTTCTCTTCGGTCGGAAAGGTGGCCTTCTGTGA

Protein sequence:

>DPOGS205047-PA
MEHQNLREVNYIILTNDTEDGSPTAEEQEAATAIALKKRTGALERENRALRDEAARLAAGADSAELAERQLLRDIASQLSSANSEASVLSSELAEERQRSTDLQHQLDSTSARLALSERSLQQLTVEHEHTIRILEITKDNQNALASELADAKERYAEVAALLAEAQEQLRAVRRRGESTRGLMPSVAAAAGLLPASLHREMHSSVYSELSLDSGIGDPLAHSSMQKVFETVQCASRWSGASLSGSEDDVAPRVFKPVPKTTSDSFFEDTSDTESEDLYPGNAAVGVPGAPGAAELAAALRRLTPQEINSRRASLAASHLLHQRRRSDRDASEESAVWGAGAAGGIARFRAPHKLQIVKPMEGSLTLHTWAQLAKPNMSGLLEEQEGVGVRGSRSAQSLGMRVYRLSDVEEDDDMPRLPHSSHIYTYTNSTVLHPNDGSLVGSSVSSVCSSGMSSLSSSVLGSAWSSRLTSRRSSAAVSPVHSRRESLCVPVQRSHFTPTATPANSPLLGSPDSSPPPTPRPGDAPPSLHALIASGTSILRRRYLTSPNSDGSPAPLALQTPGSLYMGLVHRSPMEQLTCLKRTLRSPAAAPSERSDDADAPLGVPAHPGEGALDVAASMGLGCVTGPSNGARRPRVRAPRPRTDLGTVGTAPAANNVPAHSSPLGTLSTFLFGRKGGLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: