MonarchBase - Protein-coding gene

DPOGS208937
Transcript	DPOGS208937-TA	2598 bp
Protein	DPOGS208937-PA	865 aa
Genomic position	DPSCF300009 + 120712-129354
RNAseq coverage	545x (Rank: top 23%)

Annotation
*Heliconius*	HMEL004766	1e-134	68.85%
*Bombyx*	BGIBMGA002409-TA	0.0	81.07%
*Drosophila*			%
EBI UniRef50	UniRef50_E0VS10	3e-159	52.66%	Angiomotin, putative n=1 Tax=Pediculus humanus corporis RepID=E0VS10_PEDHC
NCBI RefSeq	XP_002428904.1	6e-160	52.66%	angiomotin, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242016775	1e-158	52.66%	angiomotin, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|383853920	3e-161	49.24%	PREDICTED: uncharacterized protein LOC100883025 [Megachile rotundata]

Group
KEGG pathway	ptr:451491	3e-43
	K06104 (AMOTL1, JEAP)	maps->	Tight junction
InterPro domain	[43-819] IPR009114	7.6e-55	Angiomotin
Orthology group	MCL16818		Insect specific

Nucleotide sequence:

>DPOGS208937-TA
ATGGGGTCCATGCGACCTAATGGACGTTTCCTTTCATTTGCTAATAACATACAGAGAACTCAAAAGCAACCTGTCCCAAGTGGATTTCCTCAAAGTCTATCCGGTAGTGAGACAGATGTGTCCACATCAAATGAGAATCTGTCAAGAGAGGAGAGGTATGTTGTGAGGCACACAGCACGAGTTGAACCACAAGGACAGGAAAATCAAAGTCAGACTAACAATAATAATAACAACAATAGAAACACATTGAAGGATAATGTAGGGGGCAGTAACCGCAACTCACTAAAAGACTCAGTAGGTGGAGGTAACAGCAATCGGAGTTCGCTGGATGTTTCATCATCATCATATAACACTCTGATCATTCATAACCAGGACGACTCCTGGTCTTCAAGACCAACACCAATTAGGGAACATGAAAGAACAAACAGTGAAGTTAAGCATTCAAATACACAGTCTTCCCCATACCACACTTTAAAAAAGAGTGATGCAGTGAAGAAGCCTAGCGGGATTCCGCTACCCAAAGTTCACAAAGAGCAGACTGTTACAGCGAGTGCTAATTATATTGATATTGGAGGTCAGAGGATATATACAAGCCCACCGGATCAAGGGGTTCAGGAAATAAATGAAATACCGGATGATTTTCTGAATCAGTCATCAGTTCTGAAACATCTTGCTAAGGAAGTAACCCAATCTCCGACACCTCGAGGGCTCACACCTCCAGCGTCTCCCCACTCGACTCGAGCTCCCTCGAAACCCCGTGAAGAGAGGAAAGGAAAAGGATCGAAAGCTAAACTCAGTAAGGAGAAGTTGAATTTGTCAAGATCACAGCCCGATCTAACAAGTGTTGGCGTCCGAGCAGTACCAGGTGGATCAGAGTCCAGCGGTTGGTGTAGTGGAGGGGAGGGTTCTTTGGAGGAGGCTGATGACGCGTTTGCAGCTGTTCTGGACGCTCTTGCAGCTGAGAACCACGCTCTAAAGAGACAGCTGGCTGACGCGTGCGAGCGAGTCGCTAAGACACATAAGTTGGAGCAGGAGGTGGAAAAGGTTCGTACTGCCCACGAGGAGCTCGTGGGCTCGTGCGAGCGACGGGAGCGGCTGGAGAGAGCCGCTCGGGTCAGGCTGCAAGCTGACTGTAGACGCCTACACGAGATCAACAGGGCTCTCAAACACCAGACGGAGTTACTGTCATCTGGAGGTCGAGCGGAGGGCGGCGCTAGTGTGGAGGCTCTGCGGAAAGAACTACAAGGACGGGAGATGCTCATAGCACAACTCATTACACAGAATAAGGAGTTGGCTTGCGCTAAAGAGCGTCAAGAGATAGAGATGTCAGCTCAGCGGGCGACTCTACAGGAACAGAGGACACACATCGACATACTGGACACGGCGCTGACTAACGCTCAGGCTAACGTGGTCAGGCTGGAGGACGAGTGTCGTCACGCGAGTGGGTACGTGGAGCGCGTGCTGGGTCTGCAGAGGGCGCTGGCGTCGCTGCAGCAGGCCTCGGACAGGAGAGAACACACGGAGAGGAAACTCAGGGCGCAGCTCGAGACAGAACTACAGGCTCTCAGGAAACGTGAGTGTGTGTGTGGCGGTGTGGATACCTCCGGTGTGAGTGGTGGTGGGGGCGGCGGGGGAGGGGGCGCCGCGTGTGGGGGGGAAGCGGGGGCGGAGGCCGAGCTCAGGCGGGCGCTGCGGTCGAGGGACGAGAGGCTGCTGGCTCTAGAGGGGGAGTGCGCCAAGTGGGAACAGCGCTACCTCGAGGAGGCCGCACTCAGACAGGCGGCGGTGTCCGCAGCATCCATACCCAAGGACGCTAAGATCGCGGCCCTGGAGAAGACGTCGGCGGAGTCCGAGCGACTGATGGCAGAGGCTCGCAGCGAGAAGATACGGCACATGGACGAGCTGCACTCTGCACAGAAGAAGGTCGCCGACCTGGAGAGCAGGCGGGCGCTGCGGTCGAGGGACGAGAGGCTGCTGGCTCTAGAGGGGGAGTGCGCCAAGTGGGAACAGCGCTACCTCGAGGAGGCCGCACTCAGACAGGCGGCGGTGTCCGCAGCATCCATACCCAAGGACGCTAAGATCGCGGCCCTGGAGAAGACGTCGGCGGAGTCCGAGCGACTGATGGCGGAGGCTCGCAGCGAGAAGATACGGCACATGGACGAGCTGCACTCCGCACAGAAGAAGGTCGCCGACCTGGAGAGCAGGGTTAAAGAGCTAGAGTCCAAGGTGGCGGAGCGTGATGCGATGATCAAAGTGCTGCAAAAGCACACGAGCGCCGCCTCGCTCAGAAACAACTCGAGTCGAGAGGAACTCGTGGGTCTGTCGTCGGGAGCGTCCTTCTCCAGCGCGGAGGGCGTGGGCTCTGCCGGCGTCACCAACCGCTACAGACACCTCGCTAGGAGGAACTACTCCCCTCACAACGACAACAGCGGCTGCGGGTTCGACAGTTCGTCTCTTCGCCTGGAGGAGCAGTTGGCCGCGCTGGAGTCCCGCCTGGACCGGCCGCCGGTGCCCGCTGTGAGTTACCTCTCAGACGGCCCCCCCTCCCCACACTCCCCGCACTCCCCCCACCCTCGACCACACGCCAGCTACTACTAA

Protein sequence:

>DPOGS208937-PA
MGSMRPNGRFLSFANNIQRTQKQPVPSGFPQSLSGSETDVSTSNENLSREERYVVRHTARVEPQGQENQSQTNNNNNNNRNTLKDNVGGSNRNSLKDSVGGGNSNRSSLDVSSSSYNTLIIHNQDDSWSSRPTPIREHERTNSEVKHSNTQSSPYHTLKKSDAVKKPSGIPLPKVHKEQTVTASANYIDIGGQRIYTSPPDQGVQEINEIPDDFLNQSSVLKHLAKEVTQSPTPRGLTPPASPHSTRAPSKPREERKGKGSKAKLSKEKLNLSRSQPDLTSVGVRAVPGGSESSGWCSGGEGSLEEADDAFAAVLDALAAENHALKRQLADACERVAKTHKLEQEVEKVRTAHEELVGSCERRERLERAARVRLQADCRRLHEINRALKHQTELLSSGGRAEGGASVEALRKELQGREMLIAQLITQNKELACAKERQEIEMSAQRATLQEQRTHIDILDTALTNAQANVVRLEDECRHASGYVERVLGLQRALASLQQASDRREHTERKLRAQLETELQALRKRECVCGGVDTSGVSGGGGGGGGGAACGGEAGAEAELRRALRSRDERLLALEGECAKWEQRYLEEAALRQAAVSAASIPKDAKIAALEKTSAESERLMAEARSEKIRHMDELHSAQKKVADLESRRALRSRDERLLALEGECAKWEQRYLEEAALRQAAVSAASIPKDAKIAALEKTSAESERLMAEARSEKIRHMDELHSAQKKVADLESRVKELESKVAERDAMIKVLQKHTSAASLRNNSSREELVGLSSGASFSSAEGVGSAGVTNRYRHLARRNYSPHNDNSGCGFDSSSLRLEEQLAALESRLDRPPVPAVSYLSDGPPSPHSPHSPHPRPHASYY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: