MonarchBase - Protein-coding gene

DPOGS213876
Transcript	DPOGS213876-TA	2487 bp
Protein	DPOGS213876-PA	828 aa
Genomic position	DPSCF300141 - 23747-35133
RNAseq coverage	45x (Rank: top 71%)

Annotation
*Heliconius*	HMEL003468	5e-170	69.67%
*Bombyx*	BGIBMGA013429-TA	4e-120	63.07%
*Drosophila*	CG31272-PA	5e-70	34.55%
EBI UniRef50	UniRef50_D6W8I7	5e-79	38.29%	Putative uncharacterized protein n=4 Tax=Tribolium castaneum RepID=D6W8I7_TRICA
NCBI RefSeq	XP_001994652.1	1e-104	29.03%	GH17356 [Drosophila grimshawi]
NCBI nr blastp	gi\|195055494	3e-103	29.03%	GH17356 [Drosophila grimshawi]
NCBI nr blastx	gi\|91076754	3e-78	37.01%	PREDICTED: similar to synaptic vesicle protein [Tribolium castaneum]

Group
Gene Ontology	GO:0055085	1.3e-17	transmembrane transport
	GO:0016021	1.3e-17	integral to membrane
	GO:0022857	4.2e-14	transmembrane transporter activity
KEGG pathway	tca:660155	2e-41
	K06258 (SV2)	maps->	ECM-receptor interaction
InterPro domain	[404-820] IPR016196	1.6e-41	Major facilitator superfamily domain, general substrate transporter
	[59-341] IPR011701	1.3e-17	Major facilitator superfamily
	[405-636] IPR005828	4.2e-14	General substrate transporter
Orthology group	MCL14702		Insect specific

Nucleotide sequence:

>DPOGS213876-TA
ATGACCGTGGCGGACGCGGAGGCCGCTTCCAGGAAGGAAGAGATCTCCCACAACCACCTGTACAAGGTCACGGGACTGTCCTCGTCCAATTTGGAGAAATTAGCTCAAGAACCAGAGGCAGACTTCGAAGAAGCAATATCAGCAACAGGCTACGGGTGGTTTAACGTGATGCTACTCCTCTGCACCCTGCCAGCCTTTTGGAGCGCGGTGTCTATCACCAGCGCCGCCTCCTACATCTTCAGCAGGGCTCAGTGCGACATGGAGCTGCGACTGCACGACCTGGGCACCGTCACCGCTATGTCTTACATCGGAATGATCAGCTCGGCCATGGTGTGGGGATACGTCTCCGACACCCTTGGGAGGAGGAGTATCCTGGTGTGGGGGTGTCTCAGCAGCGGCCTGGTGGAGGTCGTGGCTGCCATCAGCCAGAGCTTCACCATGCTTCTTGTGATGAGATTCGCTAGCGGGTTTTTATTCAACGGTCCCTTCGCAGTGCTAATCTCTTACCTCGCTGAGCTCCACCGAGCTGACATCCGAGCTCGTGTCATTCTCCTCTCCAGTTTCTTCTTCACCCTGGCCAACACCACCCTCCCGCTACTGGCGTGGGCTATTATCACCCAAGACTGGGAATTCACACTTTTCGGAGGTGGAATGGTCCTCCATTCGTGGAACATATTCCTGTTGGCCACGGCGATGGTGCCATTACTGACGGGACTGGCAGCCGTCTGCTTGCCAGAGAGCCCCAAGTTCCTCATGTCGAGAGGTCGCAACGATGAAGCTTTAGTAATATTGAAAAAAATATACTCCTGGAACACTGGCAGGCCACCCGAGACCTACCCGATAACTCGCCTAGCTCAAGAGAAACATCCACAACGTGGCCGCGGGCTGGAGGCGCTCCAGGGCGGCGTGGCCCAGCTCTCGCCGTTGTTTCGTCGACCGCATGCCGCTTGGTTGCTGCTGATATGCGTCGCACACGTGTGCTGCATGTTCGGAGCAAACACTGTTCGTCTGTGGTACCCGCAACTGGCAGCCATGATAGGCTCCGAGAGTAACGCCAGCCTCTGCTCCGCCATCGCCCCGCAGCCGCTCGCGGACGAGGTCGCAGACTGCACGCCCATAGAGACGGACATGCTCACCTACTTGCAGAACGCGGTGGTGGGAGCTGGATCTGTGCTCACTTACGGAATAGGAGGCGTGCTCATCAATCGCTCGGCCATGGTGTGGGGATACGTCTCCGACACCCTGGGGAGGAGGAGTATCCTGGTGTGGGGGTGTCTCAGCAGCGGCCTGGTGGAGGTCGTGGCTGCCATCAGCCAGAGCTTCACCATGCTTCTTGTGATGAGATTCGCTAGCGGGTTTTTATTCAACGGTCCCTTCGCAGTGCTAATCTCTTACCTCGCTGAGCTCCACCGAGCTGACATCCGAGCTCGTGTCATTCTCCTCTCCAGTTTCTTCTTCACCCTGGCCAACACCACCCTCCCGCTACTGGCGTGGGCTATTATCACCCAAGACTGGGAATTCACACTTTTCGGAGGTGGAATGGTCCTCCATTCGTGGAACATATTCCTGTTGGCCACGGCGATGGTGCCATTACTGACGGGACTGGCAGCCGTCTGCTTGCCAGAGAGTCCCAAGTTCCTCATGTCGAGAGGTCGCAACGATGAAGCTTTAGTAATATTGAAAAAAATATACTCCTGGAACACTGGCAGGCCACCCGAGACCTACCCGATAACTCGCCTAGCTCAAGAGAAACATCCACAACGTGGTCGCGGACTGGAGGCGCTCCAGGGCGGCGTGGCCCAGCTCTCGCCGTTGTTTCGTCGACCGCATGCCGCTTGGTTGCTGCTGATATGCGTCGCACACGTGTGCTGCATGTTCGGAGCCAACACTGTTCGTCTGTGGTATCCGCAACTGGCAGCCATGATAGGCTCCGAGGGTAACGCCAGCCTCTGCTCCGCCATCGCCCCGCAGCCGCCCGCGGACGAGGTCACAGACTGCACGCCCATAGAGACGGACATGCTCACCTACCTGCAGAACGCGGTGGTGGGAGCTGGATCTGTGCTCACTTACGGAATAGGAGGCATGCTCATCAATCGCTGTGGCAAGAAGATGGTGGCGGGTGTGTGTGGGGTGATGGGCGCTGTGTTCGTGGGCCTGCTGCCTCTCGTCGGCAGCAGTTCGTTCCCAGTGGTCGCCATAGTGACCACGGCCCTAGCCCTCACCGCCTTGTGCTCCGCCTCCCTCTCCAGCATTGCTGTAGACTTGTTCCCCACATCATTGAGGGTGATGGCGATGGCCGTGTTCCTCATGTCGGGTCGCATGGGCACCATATCTGGAACCATCGTCTTCCCCATACTCATAGACTTCGGTTGCCTACCTCCTTTCCTGACCATAGCTGCTGCTCTAATGGCGACCCCTCCTCAATGGACTATATACATGAGAGAACGTCTTCAGGAGACATCATCCAGGGGTTACATTTCATCATAA

Protein sequence:

>DPOGS213876-PA
MTVADAEAASRKEEISHNHLYKVTGLSSSNLEKLAQEPEADFEEAISATGYGWFNVMLLLCTLPAFWSAVSITSAASYIFSRAQCDMELRLHDLGTVTAMSYIGMISSAMVWGYVSDTLGRRSILVWGCLSSGLVEVVAAISQSFTMLLVMRFASGFLFNGPFAVLISYLAELHRADIRARVILLSSFFFTLANTTLPLLAWAIITQDWEFTLFGGGMVLHSWNIFLLATAMVPLLTGLAAVCLPESPKFLMSRGRNDEALVILKKIYSWNTGRPPETYPITRLAQEKHPQRGRGLEALQGGVAQLSPLFRRPHAAWLLLICVAHVCCMFGANTVRLWYPQLAAMIGSESNASLCSAIAPQPLADEVADCTPIETDMLTYLQNAVVGAGSVLTYGIGGVLINRSAMVWGYVSDTLGRRSILVWGCLSSGLVEVVAAISQSFTMLLVMRFASGFLFNGPFAVLISYLAELHRADIRARVILLSSFFFTLANTTLPLLAWAIITQDWEFTLFGGGMVLHSWNIFLLATAMVPLLTGLAAVCLPESPKFLMSRGRNDEALVILKKIYSWNTGRPPETYPITRLAQEKHPQRGRGLEALQGGVAQLSPLFRRPHAAWLLLICVAHVCCMFGANTVRLWYPQLAAMIGSEGNASLCSAIAPQPPADEVTDCTPIETDMLTYLQNAVVGAGSVLTYGIGGMLINRCGKKMVAGVCGVMGAVFVGLLPLVGSSSFPVVAIVTTALALTALCSASLSSIAVDLFPTSLRVMAMAVFLMSGRMGTISGTIVFPILIDFGCLPPFLTIAAALMATPPQWTIYMRERLQETSSRGYISS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: