MonarchBase - Protein-coding gene

DPOGS214111
Transcript	DPOGS214111-TA	2514 bp
Protein	DPOGS214111-PA	837 aa
Genomic position	DPSCF300014 - 1881801-1885027
RNAseq coverage	295x (Rank: top 38%)

Annotation
*Heliconius*	HMEL011406	81.51%
*Bombyx*	BGIBMGA006161-TA	67.20%
*Drosophila*	CG33214-PA	48.31%
EBI UniRef50	UniRef50_E2AIP6	52.29%	Golgi apparatus protein 1 n=8 Tax=Formicidae RepID=E2AIP6_CAMFO
NCBI RefSeq	XP_001652319.1	53.68%	MG-160, putative [Aedes aegypti]
NCBI nr blastp	gi\|157114571	53.68%	MG-160, putative [Aedes aegypti]
NCBI nr blastx	gi\|157114571	53.68%	MG-160, putative [Aedes aegypti]

Group
Gene Ontology	GO:0016020	3.2e-14	membrane
KEGG pathway	isc:IscW_ISCW007750	0.0
	K06816 (GLG1, ESL1)	maps->	Cell adhesion molecules (CAMs)
InterPro domain	[133-186] IPR001893	3.2e-14	Cysteine-rich Golgi apparatus protein 1 repeat
Orthology group	MCL15033		Single-copy universal gene

Nucleotide sequence:

>DPOGS214111-TA
ATGTCGCTCCATCCCAACTGCCAATCTGAAATATCGTCACTCAAGGAGATGAAGTATAATACACTTCATTTAGATAAAATGGTATTTGCTGCTTGTAATTTAGATCAGAAAAACTTTTGTCCTGATGAAGTTCCAGATTCATTATTACTGTACAAATGTCTTGTTAGACATAAATATGAAAATGGGATGTCTAAACGTTGCCAGGATCAGTTATTTTATACACAACGAACAATGGTGCAGAACTATAAAATGAGCAAGGGCTTAGTTAAATCCTGCAAGGAGGACATTCGTAAATACCATTGTCGAAAAGGTGTAGTTGAAGATAAAGATGTCCGTCTTGCACAAATTTTATTGTGTTTAGAAAATGTTACCCGCAATGACAGCACAAAGCTCTCTCCCGAATGTGTCGCGGAAATGACAGATCATCGAAAAATGCTAATGGATGATTACAGGCTATCACCAGAATTAATGAAGAATTGTGCAAATGACATAACTATGCTATGTAGAGGTATTGAAACTGGTGGAAAAACAATTCATTGCCTAATGGACCATGCAAGACCGAGGAGGAGAAAAGATAAAAGGATCAGCTTAGCATGTCAAAGGTCATTAGAAATTCTTGTACAAGAAGCCGATCCTGGTGAAGACTGGCGAGTAGATCCGATTTTACGTAAAGCTTGCAAACCAGTTGTAGATACAGCATGCAGAGAGGTCAATGGTGGGAATGGTAGAGTTATGTCTTGTCTTATGGAAAAACTGGGAACTGTTCTCATGACACCTGAATGTGAAGCTGCTTTGATGCAAATACAATATTTTATATCTAGAGATTTCAAGTTAGATCCCCAATTATATAAAGCATGTAAATATGATGCTGTCACCCAGTGCAAAGCTAAATTGAAATGGTCTGATGCAAATGAACATCAATCTGAGAAAGATCCTCTTGTGTTACCATGTCTGTATAACTATGCTTATGACTCTAATCTGAGAGGTATATTAAAACCAGCTTGTGAGCAACAAGTTAAGAGAGTCATGAGACAAAGGGCCGTCAGTGTTGATTTACTGCCTGAAATAGCTGATAATTGCATGGATGACTTAACAAATTTATGTTTTGAAAATACGGGTAAAGGCGAAGAAATATTGTGCTTGCAAAGTAAAATTAAAGATCTTACTCCAAAATGTAAAGATGTTGTTACAAATTTTACTGAAACTCAGAGTGGTCATATAGAGTTAAATGCAGTTGTAAGTATAAACTGTAGAGTTCCTATAGAAAAGTTGTGTTCGTCGGAGCTAAAAAGTAAGAAAGATGAAGATGATATTTTGGAGTGTTTAATTATGCACAAGAATGACGCCGAGATAAAAGTCAATGTCAAATGCAGGGCAGCTATAGAACATGAACAATTGATATCACTTAAGAATTACAGATTTACTAGAAAATTTAAAAACGCATGTAAATCTTATGTTGTTAGATTTTGTCCGAAAGCACAAACAAAATTGCAGGTTGTTATGTGTTTAAGTGAAATTATAAGAAACGATACTATCACGAGACGAAAGCATACTATTTATAAAGAATGTCGTCAGCAGCTGAGAAGTCAACTTTTCCAACAAAAAGAAAATATCGATCTCGATCCTGATCTAAAAGAGGCTTGTAGAAAGGACTTACAAGAATTTTGTCCGACCATACCTCATGGAGAATCAGCTGCTTTAGAGTGTTTACAAACTGCAAAAGTAAAACTAAGCGATGGTTGTAGAAAAGCTTTATTTGTTGTTAGGAAACAGGAATTTGCAGACAATGCTATCGATTACCATTTAGTTAAGAGCTGCAGCGATATGATAGACTTGTACTGTCATAATACTGAACCAACAGTCTTATTAGATTGTCTAAAGGCGCATAGACAGGAAGACGATTTTGATAACAACTGCAAAATTGTTGTCATTAACAGAATGATAGAACAAAATATGGATTATCGATTTAATAATAATTTGCAAAACGCATGTGATGGCGATATAAAAAAATATTGTAGTAATGTTATTTTAAATGAACCAAAAGATGTAGAACTTCGTGGAAAAGTTCTGTATTGCTTAAAAGAAAAGTTTAGAGAGTCAAAATTAGAAAAAAAATGTGAAAACGAACTGGCTAACGTCTTGAAAGAACAAGCTTTAAATTATCGCTTAGATCCACTGTTAGGGAAACTTTGCAAGGCTGAAATTCAAACAATATGTGCAGTACCCAATGACTCCATAACAAACTCTGATGGTCAGGTTGAGGAGTGTCTAAAGAATGCCCTATTGAACCATAAAATAGTGTCTGCAGAATGTGCCCAGGAAGTTGTTCAAATTATAGAGGAAACTGAGGTAAATGTAATCGAAAATTTGGGAGATGTCTACACTGAAATATCATCTTCACCGTCTAAGAAATATTTTCTAGTTGTAGGGATATCCATTGTGGGCTTAATTTTTATATTTGGTCTATATTGTGGTCGTATGACAAAAAGGGCTATGTATATAAAGAGAAAATAG

Protein sequence:

>DPOGS214111-PA
MSLHPNCQSEISSLKEMKYNTLHLDKMVFAACNLDQKNFCPDEVPDSLLLYKCLVRHKYENGMSKRCQDQLFYTQRTMVQNYKMSKGLVKSCKEDIRKYHCRKGVVEDKDVRLAQILLCLENVTRNDSTKLSPECVAEMTDHRKMLMDDYRLSPELMKNCANDITMLCRGIETGGKTIHCLMDHARPRRRKDKRISLACQRSLEILVQEADPGEDWRVDPILRKACKPVVDTACREVNGGNGRVMSCLMEKLGTVLMTPECEAALMQIQYFISRDFKLDPQLYKACKYDAVTQCKAKLKWSDANEHQSEKDPLVLPCLYNYAYDSNLRGILKPACEQQVKRVMRQRAVSVDLLPEIADNCMDDLTNLCFENTGKGEEILCLQSKIKDLTPKCKDVVTNFTETQSGHIELNAVVSINCRVPIEKLCSSELKSKKDEDDILECLIMHKNDAEIKVNVKCRAAIEHEQLISLKNYRFTRKFKNACKSYVVRFCPKAQTKLQVVMCLSEIIRNDTITRRKHTIYKECRQQLRSQLFQQKENIDLDPDLKEACRKDLQEFCPTIPHGESAALECLQTAKVKLSDGCRKALFVVRKQEFADNAIDYHLVKSCSDMIDLYCHNTEPTVLLDCLKAHRQEDDFDNNCKIVVINRMIEQNMDYRFNNNLQNACDGDIKKYCSNVILNEPKDVELRGKVLYCLKEKFRESKLEKKCENELANVLKEQALNYRLDPLLGKLCKAEIQTICAVPNDSITNSDGQVEECLKNALLNHKIVSAECAQEVVQIIEETEVNVIENLGDVYTEISSSPSKKYFLVVGISIVGLIFIFGLYCGRMTKRAMYIKRK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: