MonarchBase - Protein-coding gene

DPOGS200402
Transcript	DPOGS200402-TA	1407 bp
Protein	DPOGS200402-PA	468 aa
Genomic position	DPSCF300236 - 577236-580520
RNAseq coverage	6x (Rank: top 87%)

Annotation
*Heliconius*	HMEL014735	2e-33	68.89%
*Bombyx*	BGIBMGA008979-TA	6e-78	64.25%
*Drosophila*	Prosap-PA	5e-10	31.14%
EBI UniRef50	UniRef50_C3NIT9	3e-13	29.07%	Ankyrin n=7 Tax=root RepID=C3NIT9_SULIN
NCBI RefSeq	XP_001122606.1	1e-17	32.97%	PREDICTED: similar to Ank2 CG7462-PC, isoform C [Apis mellifera]
NCBI nr blastp	gi\|123404694	8e-15	34.22%	ankyrin repeat protein [Trichomonas vaginalis G3]
NCBI nr blastx	gi\|123404694	4e-15	34.22%	ankyrin repeat protein [Trichomonas vaginalis G3]

Group
Gene Ontology	GO:0006520	9e-14	cellular amino acid metabolic process
	GO:0005515	4e-05	protein binding
KEGG pathway
InterPro domain	[268-444] IPR020683	2.6e-31	Ankyrin repeat-containing domain
	[270-444] IPR006034	9e-14	Asparaginase/glutaminase
Orthology group	MCL25560		Lepidoptera specific

Nucleotide sequence:

>DPOGS200402-TA
ATGGAAAGTGATCCCGACCCTATACTAAGTAGAACATCGGAAAATATCTCTCTACAAAGCAATATTGCATCTGGAAACAGTTCTGTTACTACTGAAGATGTCGAAAACACGAAAAGCAATACTAAAGATGACATCAGCTTACAATGTACATCAACCCAAAACCACACAAACACAAACGTGGACAGAGAACCAGTTTTTGTATTAGTGGACTCAAGATGTGTAAGCAGTCCCAGCTCCAGGGAAATCCTTATTAATAAAATAAACGTTGCACAAGATTCGACTAACAAGAGTCCGAAAAATAAGGTCATACATGTCGATACTCCTTGCACAAGCACAGCATATGCGGAATATATAACGATCCAAAGTCGGACATCCGATTCCATTGATGAATTGGAAATGATTGATATAAATTTACAAAGCGACAATGAAATTCCCATCGATACAAAACCAGATTCAATTGTTGTGGCATATTTACGAGATAAAAGCGAAGTCATAGATAAAGATGAACCAAGTTCGTCTAAAAAAATGTCGTTGCTCGATAACCTATCCAAAATGGAAACAATACCGGAAACTGAGCGGCTTTCTACATTTTCAATTCCATCAAATTCAAGACATGAAAGTATATCAGAAACCTCGTTGGATGTACACATACCTTCATATCCTGGGTCACCTCGATCTATTGACTTCAACTCAAGTAGTTCAATAGAATCCATAACCGTGCGTAACCCACAATTAAGAGACGCTATTGAGTTTCTGCATCAGGACAAGGAATTTCTTATAGCTGCTGAAACGGGAAATGATAAGCTCCTTGCAAAACAGGGAACTGACATACATCAATTCGATCACATCGGAAGAAGTGCTTTACACTTGGCAGTCTGCTCTGATAACACGAATGCTGTCAAAATGCTGCTGGAAGCTGGTCTTAATCCAAATATTAAAGATAATTTAGGGATGACTCCACTTTCGCTATCTTTGATGAGGAGGCCATCCACTGTTGTAGCTAATCTTCTTTTCGACCACGGAGCAGTGTTGATGCCACGAACAGACCCGATGGACACCGGCTTATTTATTCAATTTGTAATGATGTGCACACCCACATCTGAAGAAGAGAATATTCTACGACTACTTGTAGATAAAGGGGCTGTAATAAATGATACTGACGCTCCGGGACAGCGACAAGCCCTCCATTTTGCGGCTATGAGCAATAACGTGAACTTAATCCGCATTTTAGTGGGCCTGGGTGCGGATTTGTATTTGAAAAATCATAGAGGAGAAACGCCAAAAGACGTAGCCGAAATATTTCATTGTAGGGAAGCATTTGACTTACTGAACTATCTTGAAGAAATCGAAGAAGTAGCAATAACCGCTAATTCGAATACTTTACTGTTTGAAATCCCTGAAAAATAA

Protein sequence:

>DPOGS200402-PA
MESDPDPILSRTSENISLQSNIASGNSSVTTEDVENTKSNTKDDISLQCTSTQNHTNTNVDREPVFVLVDSRCVSSPSSREILINKINVAQDSTNKSPKNKVIHVDTPCTSTAYAEYITIQSRTSDSIDELEMIDINLQSDNEIPIDTKPDSIVVAYLRDKSEVIDKDEPSSSKKMSLLDNLSKMETIPETERLSTFSIPSNSRHESISETSLDVHIPSYPGSPRSIDFNSSSSIESITVRNPQLRDAIEFLHQDKEFLIAAETGNDKLLAKQGTDIHQFDHIGRSALHLAVCSDNTNAVKMLLEAGLNPNIKDNLGMTPLSLSLMRRPSTVVANLLFDHGAVLMPRTDPMDTGLFIQFVMMCTPTSEEENILRLLVDKGAVINDTDAPGQRQALHFAAMSNNVNLIRILVGLGADLYLKNHRGETPKDVAEIFHCREAFDLLNYLEEIEEVAITANSNTLLFEIPEK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: