MonarchBase - Protein-coding gene

DPOGS207762
Transcript	DPOGS207762-TA	3138 bp
Protein	DPOGS207762-PA	1045 aa
Genomic position	DPSCF300042 - 333516-340453
RNAseq coverage	178x (Rank: top 50%)

Annotation
*Heliconius*	HMEL017550	0.0	59.69%
*Bombyx*	BGIBMGA005314-TA	2e-111	67.48%
*Drosophila*	CG7837-PA	1e-16	32.92%
EBI UniRef50	UniRef50_D6WIH0	2e-40	27.61%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WIH0_TRICA
NCBI RefSeq	XP_392779.2	1e-31	25.32%	PREDICTED: similar to CG7837-PA [Apis mellifera]
NCBI nr blastp	gi\|270003223	9e-40	27.61%	hypothetical protein TcasGA2_TC002427 [Tribolium castaneum]
NCBI nr blastx	gi\|270003223	4e-41	25.61%	hypothetical protein TcasGA2_TC002427 [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	6.4e-25	binding
	GO:0005515	1.3e-07	protein binding
KEGG pathway
InterPro domain	[1-371] IPR016024	6.4e-25	Armadillo-type fold
	[323-362] IPR011989	2.4e-21	Armadillo-like helical
	[869-974] IPR011333	2.8e-09	BTB/POZ fold
	[869-974] IPR013069	1.3e-07	BTB/POZ
Orthology group	MCL25126		Lepidoptera specific

Nucleotide sequence:

>DPOGS207762-TA
ATGGATAAAACACAAGTTAAGGCCATGTTAGATGGACTTAAATCTTCAACTTCAAAAATAATCCAAGAGTCTTTATTAAAAATTAAGTCAATGATTGTTAATTCTGAGAAAGGAGCTAAACTCTTCAGGGAATGTAATGGTTTTCCTTACCTGGTACCACATCTGCTGAAACCAAATGAAAATATTCTGAATCTAACATTAAGTATCCTGGGGGACCTGTGTCTAGATCAGAAAAACTGTATGGCTATTGGAAAATTGAATACGTATGGACCTTTGGTAACGATATTAAATACGGTATGTCGCGATAGCATTCTAGGGAGGACATCCCGTTTAATTGGTAATTTGGCTCGTGACAGGAGTAATGCTGAAAAATTTTTTAATCACGGCACGGTAAAAGCGCTGATGGCCATTATTGATAATAGGGATAAAAAAACCTCGTACGCAACCCTCATTATGGTCGTAAGAGCTATTCGGAAGTTGTGGTCGGTGGAAGAGAAGAGAAATGAAATGATTAGTATGAACGCGATCCGTTGCGTTGCTGTATTGATGACATCTGAATGCGAGATCATGGGCTACATTAAATCCTCTGACAGCGACAGTGACGTCGAAGAACCTAGTAGGCTCCAAGAGGACTTTATGGGTGGCATCCTAAAATGCATATGGAGTTTCACTTCGCACCCCGTCGCGTCTTGTGCTGAACAGATCCAAGGCGACGGCCGCGGCTATCAGTGCCTGGTGGTGTTAACAAAAACAAACATGACGATAGCCATGAAGTGTTTGACGAACCTGTGCTTCATATCGTCCTGCCGGCCGCAGCTGGGTATGGCGGGATTCGTCGAATGTCTCATAGAGAATCTGAAGAAGGAGAAGGACGTGTCATATTGGCCGGACGGGTCACCTATGGCTTTGGCCCAACTGAGCGGGGAATCCGTGAACAGATCTCGTCTCCGCCGCTGTGGGCCAGACGGAGATGACCACTGGCGCGCTAAAACAAACACACATGCGATGAACGCACTGCTACAATACGTTTTTGATGATTCTTCGTTCCAAATACTTATCGGCGAAGGACTTGTTAGTATATTGACGGACAAATTAACTACGTACGTCCGTAACATGGGATATGAGCACAACGTGGAGACCAGTGCGAGCAACAAGCGTAAAGAGAAACCTGTGAACCAGGGTTCTGTGTACGATGTGGCTGTTCAGAACCTATCCAGGGATATGTACTACCGTCCCGCCTCTGGTTCTTCCAAACGAAAGAGTCAGCTGCTGTCAGATACAGGGGATGATATGAAGGTTGTGATAGAAAGGGACAACATGATCGTCGGTTTCGTCGACGCCATAGAGAGCGAGGCGAGCGAGAGCGAGAGCGAAAATGAGGAAGGTCCTCCGCCCAAAAAAAGAAATCTGAAACGATCCAAATCCAAGAGTCCGAAGAATTCTAAAAAGAAGTCAACAAACATAGCAAGTAAAGACTGGTCGTCGGGTGTGTATTGGGAGCCAAAAAGTCCAGAGTGGCCGCCGATGCTGCAATCTAATCCCTCTACGAGTCCGAAAAAGGAACCCCAATTACCAGACCTTAATGTTCAGTACACGGGTCCGGGTTCCGCAGAGAGGTTAAATTTCGAATGGAGTCCTGAATCTGGTGTCAGTATCGGAGAATTCTGTACACCGCCTTATCCACCGTGGAGTCCAACCAGACTGACGCCATCTCCTTCCAGCTTAAGCAATGAGGACGAAAGTTCAGACTCCGAAGCCTCGGGCAGCTATTCACCGGTTTGCAGTGACAACGATGAAACTAACGAAGGCACTACCACCAAGACACAGGATGTCGAGGTCATCGAAATAGACGAGGACAGCAACGAAGGGGAATGTGATATGGAAGACCTAAGTAAGCTGAACATACATTCAAAGGAAACAAACATAGCGAGTGTGATGGTACTATTGTTTCGCGTATCTCACGGTACTTGCACCACCTGTGGTAGCATCAGAGATGACTCCGTTCCCAACCACACCATGGATTACCTCACCACCCGGGAATGTCTGTATGGTCTAATGGAATACGTTGAGAAATGTAAACGCCCCATGGGCAGGGCGGCGAGGATACTAGCCAGGGTGTTGAGTAGCGACCTGTGTCTAATGAGTGTGATGAGGCACAGACTAGCGTTACGACTGCATCGCATGTCCACTACTTCTAAACACCCAGCCGCAGAATGCGTTCAATGCAAACAGATTATGAAACTCTGCAAGAAATTAATGAATCAAATGGGTTCATTGGCTGAATCCAGCTATGGTATTGGAAAAATTAGTTATCATCTACTTAAAGGCAGTCCGTCAATGAAACATACACTGGCATTGACCTTGCCGTATATTGTCAAGACTGAAAAAGCATTAAAGAAATATTTAGTAGATTGCAACGGTCTGAACATATTAATAAATCTCATAGACGATGGCAAAGAAGAATTACAAGAATGTGTCACAGCACTTTCAAAACTCGCACACAACGTTGATGTGAAGGATCCTAAACTCTTAGAGAACAGGTACAAAGAAACCGTCCTAATGATCTACGAACCGACCTTTGACAGTTTGTCCCCGGACAGTATCGTGACATTCAAACTGGACGACTCGTCCACTGTTAGAGCGAACAAAGACTTTTTATGCCAGCATTCGGAATATTTTAACGCCATGTTGATGGGACGCTTCAAGGAATCCGCTGAGAACTGTGTCCGTCTGAAGAATGTCACCAAGAGCGGTTTGGAATACCTCCTGACCTTGTTAGACTGCGGCCTCTACGACGCCCATTCCGACTTACAAATCTTTCCAATGGCGCCAAGTTTGAAGACGAATCTGGAGGTTCTGTTATTAGCGGACAGGTTTTTGTTCGAGAAATTAAAAGAATTATTAAGCAGTGCTATATTACAGTTCAAACTGGGCCCGAACACCGCTGACAGAATATATACTTGGTCGTTGAGCGATGGAATGGGTTTCCTCTGTGTGGAGGCAGTAGCGTATATACTTACAGGGAAGATGTCCGACGAGAACAGATATCAATCGTTTAGTAAAATACTTAACCTCCAATACAGGGATCAGTTTCTTGAAGATATTAAGGCTATGCTTTTAAGGCAAATGGCAAAATAA

Protein sequence:

>DPOGS207762-PA
MDKTQVKAMLDGLKSSTSKIIQESLLKIKSMIVNSEKGAKLFRECNGFPYLVPHLLKPNENILNLTLSILGDLCLDQKNCMAIGKLNTYGPLVTILNTVCRDSILGRTSRLIGNLARDRSNAEKFFNHGTVKALMAIIDNRDKKTSYATLIMVVRAIRKLWSVEEKRNEMISMNAIRCVAVLMTSECEIMGYIKSSDSDSDVEEPSRLQEDFMGGILKCIWSFTSHPVASCAEQIQGDGRGYQCLVVLTKTNMTIAMKCLTNLCFISSCRPQLGMAGFVECLIENLKKEKDVSYWPDGSPMALAQLSGESVNRSRLRRCGPDGDDHWRAKTNTHAMNALLQYVFDDSSFQILIGEGLVSILTDKLTTYVRNMGYEHNVETSASNKRKEKPVNQGSVYDVAVQNLSRDMYYRPASGSSKRKSQLLSDTGDDMKVVIERDNMIVGFVDAIESEASESESENEEGPPPKKRNLKRSKSKSPKNSKKKSTNIASKDWSSGVYWEPKSPEWPPMLQSNPSTSPKKEPQLPDLNVQYTGPGSAERLNFEWSPESGVSIGEFCTPPYPPWSPTRLTPSPSSLSNEDESSDSEASGSYSPVCSDNDETNEGTTTKTQDVEVIEIDEDSNEGECDMEDLSKLNIHSKETNIASVMVLLFRVSHGTCTTCGSIRDDSVPNHTMDYLTTRECLYGLMEYVEKCKRPMGRAARILARVLSSDLCLMSVMRHRLALRLHRMSTTSKHPAAECVQCKQIMKLCKKLMNQMGSLAESSYGIGKISYHLLKGSPSMKHTLALTLPYIVKTEKALKKYLVDCNGLNILINLIDDGKEELQECVTALSKLAHNVDVKDPKLLENRYKETVLMIYEPTFDSLSPDSIVTFKLDDSSTVRANKDFLCQHSEYFNAMLMGRFKESAENCVRLKNVTKSGLEYLLTLLDCGLYDAHSDLQIFPMAPSLKTNLEVLLLADRFLFEKLKELLSSAILQFKLGPNTADRIYTWSLSDGMGFLCVEAVAYILTGKMSDENRYQSFSKILNLQYRDQFLEDIKAMLLRQMAK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: