MonarchBase - Protein-coding gene

DPOGS213569
Transcript	DPOGS213569-TA	1470 bp
Protein	DPOGS213569-PA	489 aa
Genomic position	DPSCF300033 + 25810-32060
RNAseq coverage	1051x (Rank: top 12%)

Annotation
*Heliconius*	HMEL010863	5e-144	78.29%
*Bombyx*	BGIBMGA011641-TA	6e-102	83.03%
*Drosophila*	CG3529-PB	7e-110	45.21%
EBI UniRef50	UniRef50_UPI00022C9573	3e-127	51.84%	UPI00022C9573 related cluster n=3 Tax=unknown RepID=UPI00022C9573
NCBI RefSeq	XP_001122551.1	1e-129	51.15%	PREDICTED: similar to CG3529-PB [Apis mellifera]
NCBI nr blastp	gi\|270004201	3e-132	51.98%	hypothetical protein TcasGA2_TC003525 [Tribolium castaneum]
NCBI nr blastx	gi\|307213014	4e-131	51.73%	TOM1-like protein 2 [Harpegnathos saltator]

Group
Gene Ontology	GO:0006886	9.8e-44	intracellular protein transport
	GO:0005622	1.2e-17	intracellular
KEGG pathway	mdo:100026791	9e-22
	K04705 (STAM)	maps->	Endocytosis
			Jak-STAT signaling pathway
InterPro domain	[1-489] IPR014645	2.4e-125	Target of Myb protein 1
	[14-150] IPR018205	9.1e-61	VHS subgroup
	[6-155] IPR008942	6.5e-59	ENTH/VHS
	[9-150] IPR002014	9.8e-44	VHS
	[207-302] IPR004152	1.2e-17	GAT
Orthology group	MCL12427		Single-copy universal gene

Nucleotide sequence:

>DPOGS213569-TA
ATGTCGTTTTTTGGAGTAGGGAACCCATTTGCTACGCCGGTTGGTCAGAAGATAGAACAAGCTACCGATGGATCTCTACCATCAGAGAATTGGGCCCTTAATATGGAGATATGCGATATAATAAATAGTAGCACTGACGGACCCAAGGATGCAATTAAGGCCATAAGAAAGAGGTTGACTCAAAGTGCAGGCAAAAACTACACCGTGGTCATGTATACACTAACTGTATTGGAAACCTGTGTTAAAAATTGCAGCAAAACATTTCATGTTCTAGTATGCAATAAGGAGTTTATATCAGAACTGGTCAAACTCATTGGACCCAAAAATGATCCACCGACTGTGGTACAGGAGAAGGTTCTCAGCCTCATTCAATGTTGGGCGGATGCTTTCCAAAACCAACCTGAATTACAGGGCGTTGGTCAAGTGTATAATGAATTGCGCAACAAAGGTGTCGAGTTTCCAATGACAGACCTAGATGCCATGGCGCCAATTTTCACACCGCAGAGGAGTGTGATTGACGGCGGGGAGCCGGTAGTTGGTTCTCCACAACGTACTATTCAGCAGAACTCTCCAAGTCGACCATCTCAGGAGCAAGTCGTAGGGACAATTCTGTCAGACAGTCAGAGCAGTAAGCTGCGGGCGGACCTGTCAGTGGTTGAGGGGAACATGACAGTCATGAACGACATGCTGACCGAACTCACAAGCCTTCCATACACACAGCATCACGAACAAGACATCGAACTGCTGAATGAGCTAGCAGACACCCTGAAGGCGATGCAGACTCGTGTCGCTGAGCTGGTGGGTCGTTTAGGGGAATCCCCGCTGACGGCCGACCTTCTGCTGACCAATGACCGCCTCCACAACCTGTTACTGAGACACTCCAGGTTCATCAATAACAGAATTGCCGCGACTGGTGGGGCGACGCCATCCGCCATTTTGGGCGCCGCCATGGGTGTGCCGGGCGCCACTTCACCTGAGAAAAAAGATGACGACGCTTTAATTGATCTCAGTGATGACGTACCCGATGTTGCTAAACTATCTGTTAAAGACGATACAATCGATAAATCACCAAGCAGTTCCAAGGATGAGTTCGATATGTTTGCTCAGTCTAGGAACGTTACCTATGAGACCACTAAGACGGGCGGCAGTAGCTATGCTGATAATGCTGAAGCTCCCGTCGGAGGTCTAGGAACCGCTATGAGGGCTCATAACACACTGCCGACAGGAATGGATCAAAGGGAATTTGATGAAATATCGGCTTGGTTGGCCCAAGAGAAGGCAGCGACTGAAGCTAACGGACAGGAGAGTGTGACGAGCAGCGATTTTGACAAGTTCCTCGCCGAGAGGGCCGCGGCCGCAGACAGCCTGCCGAATGCTGGCCAGGGACAAGGTCAGGGTCAGGGTCAGGGTCAAGCGACGCCCCGCCACCGCCACATCAAGAAGGACGAGGACTCCATGTTCGCGCTATGA

Protein sequence:

>DPOGS213569-PA
MSFFGVGNPFATPVGQKIEQATDGSLPSENWALNMEICDIINSSTDGPKDAIKAIRKRLTQSAGKNYTVVMYTLTVLETCVKNCSKTFHVLVCNKEFISELVKLIGPKNDPPTVVQEKVLSLIQCWADAFQNQPELQGVGQVYNELRNKGVEFPMTDLDAMAPIFTPQRSVIDGGEPVVGSPQRTIQQNSPSRPSQEQVVGTILSDSQSSKLRADLSVVEGNMTVMNDMLTELTSLPYTQHHEQDIELLNELADTLKAMQTRVAELVGRLGESPLTADLLLTNDRLHNLLLRHSRFINNRIAATGGATPSAILGAAMGVPGATSPEKKDDDALIDLSDDVPDVAKLSVKDDTIDKSPSSSKDEFDMFAQSRNVTYETTKTGGSSYADNAEAPVGGLGTAMRAHNTLPTGMDQREFDEISAWLAQEKAATEANGQESVTSSDFDKFLAERAAAADSLPNAGQGQGQGQGQGQATPRHRHIKKDEDSMFAL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: