MonarchBase - Protein-coding gene

DPOGS211103
Transcript	DPOGS211103-TA	1872 bp
Protein	DPOGS211103-PA	623 aa
Genomic position	DPSCF300007 - 939984-942586
RNAseq coverage	232x (Rank: top 44%)

Annotation
*Heliconius*	HMEL012460	92.03%
*Bombyx*	BGIBMGA002978-TA	90.55%
*Drosophila*	TM9SF4-PA	73.14%
EBI UniRef50	UniRef50_Q9V3N6	73.14%	GH02822p n=100 Tax=Bilateria RepID=Q9V3N6_DROME
NCBI RefSeq	XP_001658596.1	76.07%	transmembrane 9 superfamily protein member 4 [Aedes aegypti]
NCBI nr blastp	gi\|157116654	76.07%	transmembrane 9 superfamily protein member 4 [Aedes aegypti]
NCBI nr blastx	gi\|157116654	76.32%	transmembrane 9 superfamily protein member 4 [Aedes aegypti]

Group
Gene Ontology	GO:0016021	1.1e-219	integral to membrane
KEGG pathway
InterPro domain	[1-623] IPR004240	0	Nonaspanin (TM9SF)
Orthology group	MCL13159		Single-copy universal gene

Nucleotide sequence:

>DPOGS211103-TA
ATGTTCAAAGTTGAATTTCTGTTTTTAGTTAATTTAATTCTTTATAGTCATGGTTTTTATGTTCCTGGAGTGGCTCCAGTGGAGTTTAAAAAAGGTCAAAGAATAGAAGTTAAAGCAGTGAAAATGACAAGTATACATACGCAATTACCATACGAGTATTATTCCTTACCCTTATGTATTCCTAAAAATGGAACATTTATATACAAATCAGAAAATTTAGGCGAAGTTTTGAGAGGTGATCGTATTGTGAATACTAATTACGAAGTTCATATGGCAGAGAATATCAAATGCAAACTTTTGTGTCACAAAAGAAATAATCCAATGAACTGGAGCGTGGAGGAATCTGAGAAGGTTGCGAGTCGAATTGAACATGAATACTTTGTACATTTATTAGTTGATAACTTACCAGTTGCAACAAAGATTATAAATATTGATACTTCTGAAAGAACTATAGAACAAGGATATCGTCTAGGTTTTATGTCAAAAGGAAAGGCATATATAAATAACCATCTGAAGCTTCTTCTGAAATATCACAGACACAGTCAGGATTCTTACAGAGTTGTTGGCTTTGAAGTTGAGACATTTTCTGTGGACAAAGATCACTTGACATTCATTGATGATAACTATTGTCAAATTGGATCAGACATTAAACCACAACTTGTAAATGAGGATACGGGAACTAAATTGTACTTTACATATTCTGTGGAATGGGGAGAATCAGATATTGAATGGGCGTCAAGATGGGATATATATTTGGGCATGAAAGATGTTCAAATACATTGGTTTTCTATTGTCAATTCAATTGTTGTTCTTTTTTTCCTCTCAGGTATCCTAACTATGATAATGGTGAGAACACTCAGACGAGACATAGCTAAATACAATTCAGATGAAAATATTGAAGATATGATAGAAGAAACAGGTTGGAAGTTAGTTCACGGCGATGTCTTTAGACCGCCACCTAAAAGAATGCTTTTCGCAGCTGTTATAGGAAGCGGCATACAAATTTTCCTTATGGCCCTTATCACAATTTTCATTGCAATGCTTGGAATGCTGTCCCCTGCTAGTCGAGGTGCGCTTATGACATCTGCAATATTGTTGTATGTCTTTATGGGACTAATAGCTGGCTATTATTCAGCGAGATTGTACAACACAATGAAAGGCAAACAGTGGAAGCAAGCTGCATTTTTAACATCTACATTATACCCGGCTATTGTTTTTGGGACATGTTTCTTTTTAAATTTCTTCATTATGGGAAAACACTCCAGTGGCGCCGTGCCATTTTCGACGATGTTGGCACTTTTATGTCTGTGGTTCTGCATATCTGTACCTTTAGTGTATTTTGGTTATTATTTCGGATGTCGGAAACAACCATTTCAGCATCCAGTGCGTACAAACTTTATTCCGAGGAAAGTACCAGAACAAGTTTGGTATATGAACACATTAATTTGTATAATGATGGCCGGCATACTGCCATTTGGAGCTGTATTCATAGAATTATTTTTCATTTTCAATGCGATATGGGAGAATCAGTTCTATTACCTCTTTGGATTTTTATTTCTGGTTTTTTGCATACTTGTTGTATCTGTCTCCCAAATATCCATTGTAATGGTATACTTTCAACTCTGTGGCGAGGATTATCATTGGTGGTGGAAGAGCTTCATCATCTCCGGAGGATCTGCAGTTTATATTTTAATTTACTCAATATTTTACTTCTTCACAAAGTTAGAAATAACTGAATTTATACCAACATTACTTTATATTGGCTACACAGGTCTAATGGTACTGACATTCTGGCTTTTGACTGGGACTATTGGATTCTTTGCAGCTTATACATTCATCAGGAAAATCTATGCAGCAGTTAAAATTGATTAA

Protein sequence:

>DPOGS211103-PA
MFKVEFLFLVNLILYSHGFYVPGVAPVEFKKGQRIEVKAVKMTSIHTQLPYEYYSLPLCIPKNGTFIYKSENLGEVLRGDRIVNTNYEVHMAENIKCKLLCHKRNNPMNWSVEESEKVASRIEHEYFVHLLVDNLPVATKIINIDTSERTIEQGYRLGFMSKGKAYINNHLKLLLKYHRHSQDSYRVVGFEVETFSVDKDHLTFIDDNYCQIGSDIKPQLVNEDTGTKLYFTYSVEWGESDIEWASRWDIYLGMKDVQIHWFSIVNSIVVLFFLSGILTMIMVRTLRRDIAKYNSDENIEDMIEETGWKLVHGDVFRPPPKRMLFAAVIGSGIQIFLMALITIFIAMLGMLSPASRGALMTSAILLYVFMGLIAGYYSARLYNTMKGKQWKQAAFLTSTLYPAIVFGTCFFLNFFIMGKHSSGAVPFSTMLALLCLWFCISVPLVYFGYYFGCRKQPFQHPVRTNFIPRKVPEQVWYMNTLICIMMAGILPFGAVFIELFFIFNAIWENQFYYLFGFLFLVFCILVVSVSQISIVMVYFQLCGEDYHWWWKSFIISGGSAVYILIYSIFYFFTKLEITEFIPTLLYIGYTGLMVLTFWLLTGTIGFFAAYTFIRKIYAAVKID-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: