MonarchBase - Protein-coding gene

DPOGS210173
Transcript	DPOGS210173-TA	1686 bp
Protein	DPOGS210173-PA	561 aa
Genomic position	DPSCF300393 - 94442-100238
RNAseq coverage	359x (Rank: top 33%)

Annotation
*Heliconius*	HMEL012753	0.0	84.31%
*Bombyx*	BGIBMGA014142-TA	6e-143	65.69%
*Drosophila*	CG11396-PA	3e-84	41.90%
EBI UniRef50	UniRef50_E2BS49	3e-94	41.42%	Tetratricopeptide repeat protein 15 n=8 Tax=Formicidae RepID=E2BS49_HARSA
NCBI RefSeq	XP_973508.1	3e-118	42.63%	PREDICTED: similar to d-alanyl-d-alanine carboxypeptidase [Tribolium castaneum]
NCBI nr blastp	gi\|91086585	6e-117	42.63%	PREDICTED: similar to d-alanyl-d-alanine carboxypeptidase [Tribolium castaneum]
NCBI nr blastx	gi\|91086585	1e-113	42.63%	PREDICTED: similar to d-alanyl-d-alanine carboxypeptidase [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	7.6e-14	binding
	GO:0030126	5.1e-08	COPI vesicle coat
	GO:0006890	5.1e-08	retrograde vesicle-mediated transport, Golgi to ER
	GO:0005198	5.1e-08	structural molecule activity
KEGG pathway
InterPro domain	[367-526] IPR011990	7.6e-14	Tetratricopeptide-like helical
	[457-542] IPR006822	5.1e-08	Coatomer, epsilon subunit
Orthology group	MCL14239		Single-copy universal gene

Nucleotide sequence:

>DPOGS210173-TA
ATGGACAATAAGCCAACCTTGAGCCAATACTTTGGTGGCTCAGAAATTCCACCAGCCTCACAGTTTTTTGATGAAATAGGAACATCTCCTTCAGAAATGATTCAAAGTATTTATCTTGGGGAATCAGAAGCTGGCATAAGTGCACCCAGAGCTTTCACAAGTCCTCCTGACCCTCAAGAAATATTCACTAATGTAATACCCACTGTGAGTTCGGCAACTGCAGTCCCGGCTACCAGCTTACCAGATCCATCAACATTCTTTGATACAATTGGACCCGAACCTCAAATTGGTTCAAGTAAGAGCAATCTTATTTCTGCTGCTGTCATTACCGAGGCCATGGACGGACTAAGTGTTAAGAATCAACCAGTTGATAAGGAAGGAGATAGAAGAAGAGATGCTTGGATACCTAATGAAGAGGCAAAAAAAACCTTGCTAAAGGCTCAGTCTTCTCCAAAAGGATCGTTTTTTCCCGAAAGGGAAGTCCTCACTATGCCTGGGTTAGTCCTAGAAGAGGAATTGGCTGATGCACTTCAAGAGATAGCTGTGAAGTATCTTGGTGTGTCATCAGCTGGTAGCCGTGGTGTGGTCCGAGCGGAGCATGTGAGTCGGGACGAGGCAGGGCTCCGGGAGCTTCTACGGACAGGCTACTTGAGGGCTGCGGTAAATCTAACTGCTACATTACTGAGTGCTGCTGGTCAGGGCGCTGGTCGTATGCACAGACCGACGAAGCACAGTCAACGCTCACTACAGCTGTGGCTGACACGGTTCGCTGTCATGTGTCGCATCAAGTTGTACGAACCTTTACTGAAAGAGGCCGAACCGTTTGGAGATTTCACTAAACCGGATATGTTTTATGAGTTTTATCCGGAGGCTTACGAGAATCGAACCGGCTCGTTGGTACCGTTCTCGTTGCGTCTCCTCGTCGCTGAGCTACCGGGACACGTCGGCAAACCCGAAGAGGCCATGGATAGATTATACGCAATGCTAGATGTTATTGAACAGATGATATCAAACCTTAAATCCGGTAAGACGGAGGTTGGCACAGATAATATATCAGCTGAAGATCAAAAAGAATCACTGCGACTGTGGAACGGCAGGCGGATACGAGTTTTGCATTCAATAACAAACTGCGCTATAGCTCTCAAGGATTACCGTCTAGCGACGAAGATTCTGACAACTCTTAAAAATGAAGCGACTAACGTACAACAGCAGCGAGCGCTGCACAGCGCTTTATGCCGCGTAGCGCTGCTAGCTGGACACGGACGCGCCGCCGTAGCACACTGTAGCAATGCGAAGGACGCCAGAAATCATATCTGCCCAACTCCAGATGTAAGGGAGTATGTCGACTTGGGCTTAATAGACATAGCGCACGGCAAGTATCAAGACGCCTACAATAACTTTGCGAGAGCAGCTGATCAAGAACCTACTAATATTATGGTAGCTAACAATTTGGCTGTGTGTCTCTTATACATGGGTCGTTTGAAAGAAGCTATATCCGTTCTCCAGAAGGCCATACACTCGGATCCTGAGCGAGGTCTGAATGAAAGTCTTCTCATAAATCTGTGCACTCTCTACGAACTCGAGTCGTCAAAGACAAATGAAAAGAAACTTAACTTGCTGAGAATGCTTTGTAAACATAAAAGCGATACTATACCTAATGTATTGGAATGTCTGAAACTTGCTTAG

Protein sequence:

>DPOGS210173-PA
MDNKPTLSQYFGGSEIPPASQFFDEIGTSPSEMIQSIYLGESEAGISAPRAFTSPPDPQEIFTNVIPTVSSATAVPATSLPDPSTFFDTIGPEPQIGSSKSNLISAAVITEAMDGLSVKNQPVDKEGDRRRDAWIPNEEAKKTLLKAQSSPKGSFFPEREVLTMPGLVLEEELADALQEIAVKYLGVSSAGSRGVVRAEHVSRDEAGLRELLRTGYLRAAVNLTATLLSAAGQGAGRMHRPTKHSQRSLQLWLTRFAVMCRIKLYEPLLKEAEPFGDFTKPDMFYEFYPEAYENRTGSLVPFSLRLLVAELPGHVGKPEEAMDRLYAMLDVIEQMISNLKSGKTEVGTDNISAEDQKESLRLWNGRRIRVLHSITNCAIALKDYRLATKILTTLKNEATNVQQQRALHSALCRVALLAGHGRAAVAHCSNAKDARNHICPTPDVREYVDLGLIDIAHGKYQDAYNNFARAADQEPTNIMVANNLAVCLLYMGRLKEAISVLQKAIHSDPERGLNESLLINLCTLYELESSKTNEKKLNLLRMLCKHKSDTIPNVLECLKLA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: