MonarchBase - Protein-coding gene

DPOGS215110
Transcript	DPOGS215110-TA	3657 bp
Protein	DPOGS215110-PA	1218 aa
Genomic position	DPSCF300139 + 101856-117628
RNAseq coverage	194x (Rank: top 48%)

Annotation
*Heliconius*	HMEL004581	1e-118	53.22%
*Bombyx*	BGIBMGA009599-TA	0.0	39.56%
*Drosophila*	CG31150-PA	6e-38	26.12%
EBI UniRef50	UniRef50_Q177S4	1e-38	25.63%	Putative uncharacterized protein n=4 Tax=Culicidae RepID=Q177S4_AEDAE
NCBI RefSeq	XP_001657388.1	2e-39	25.63%	hypothetical protein AaeL_AAEL006028 [Aedes aegypti]
NCBI nr blastp	gi\|157112042	5e-38	25.63%	hypothetical protein AaeL_AAEL006028 [Aedes aegypti]
NCBI nr blastx	gi\|170031387	1e-38	25.27%	conserved hypothetical protein [Culex quinquefasciatus]

Group
Gene Ontology	GO:0005319	6.2e-09	lipid transporter activity
	GO:0006869	6.2e-09	lipid transport
KEGG pathway
InterPro domain	[24-195] IPR015816	6.2e-09	Vitellinogen, beta-sheet N-terminal
	[23-162] IPR015819	9.3e-07	Lipid transport protein, beta-sheet shell
	[569-768] IPR015255	1.1e-06	Vitellinogen, open beta-sheet
	[285-495] IPR011030	8.8e-06	Vitellinogen, superhelical
Orthology group	MCL25626		Lepidoptera specific

Nucleotide sequence:

>DPOGS215110-TA
ATGATATATCGATGTATACTTCTGTTTGCTGTTCTCGCCCCGGCCTCGGCGACGGGGATACAAATGCTTTTCCCTGATCAGAAGCAGTACAATTACGTTGTCAAAACAAATATATCAACGGGCGTCGCCCATAGGAATTCTTACTGGACTTTGGAGGGCAGACTAGTTGTACTTGTGGACGATAATTACTATGCCACAGTTCAATTTAAACTGGAGGATTTGAAGACATCTGTGTATAGTTATAACACCGGTTTTTCATCGTATCACACCCCCGAAGCGGCCAGGGAATTGGAGGAGCCGTGGAAAATTATTTATCAGGAGAACGGTTTCATAAGTGCAATCCAGCATTTGCCGCACGAGAGAGTTTGGGTGACGAACATAAAGCGAGCGATATCCGTCAATTTCCAGTTGAAAAAGGACGCCGGTTCTTATACCAATGAAGAGCCGTGCCTGTACGAGAGTTGTGTTATGGTGTATTCCGTGCAAGGGAACACAATCAAGAAGTATAACTCCTATCAGAAAGCGTCCATGACCTCACAGACCAGTTGGAGTTCGGTGCCGTGGAGTGGAGATTACGGGAGGGGGGTGCCCGAGAACATAGCGACCTCGCAACGAGTGTACGATCTCGATGAAAAGGGCCTCAATTGTTTGAACATGAAGGGTTTGTTCGAGTACATAGTGGACGGGCATGTGCTCACAGTTACAACTGAGTCGGTGGAGGAGGAGCTCCAGAAGTCAAATCAAATGGGTTACGAGGAACTACAGCATGAGCTATCGTGTGAGATAAGTAAATATATGAACTGTGATGTGTCTTATACCCTCAAGAGGTTACTGCCGGGGGACTTGAAGGATAATATAGAAGATGCTACAATTCTCTCACTGATCCGTAAGCTGCCGTTTAACATAGCGAATCACAGCCAGGCACTTCTTGAGGACATGGAAACTATCAGCAAGTTGGGTTTGGACTTCCCTCAAGAGATACGACATGCTGGAATTCTGTCATTTGCAATAATGGTGTCCCATTGCGTGGAGGCGATGAAGGTCAAACAGGACTATTTTGACAGCATTTTAGTCAAATACTTTAGAATGTACAGTGACTGCCCTCAATATCTGGATCGTCTTATTTGGCTCCAAGGTCTTTGTAGTTTGGGTTACACATCAGAGTCTTACATACGAACGATATACGCTGACAAAACCAGGAATAGACATGAAAGATTGTGGGCATCACTGGCTTGCGGACAGGATACCAGAGGATACAATGTCTTAGAAACTTCTTTGCCAATCTTAATGGACGACAACGAGCACATCCAACTACGTATATCAGCTCTCCACGCTATCCTCAGCTCGGGGATAAGAGAGAGCGACTTTCTTTTCCTCCACAGCTGGATATCCACCAGCCGACCTGAACTCCAGAGGTTCTGGTACTCAACTGTTAAGAGCCTTGAAAGCAACAAATTCCCTAAGTATAGAACTATTTCAGATTACATTCCTTTCGTCTCGAAGGACGTTGTTAACCCTGACTCATCACTGTGGGGCACTAACAACTACATCGTCAGTGGTGATGAGCTTAGTGGCTGGGTACAGGTGATGACTGTTGGAAACCCTGCCCCAACCCTTGCAGCGCTCTCCGTTTCTACTGGAGGACGACGGGCCTATCAGGCTTCGGTGTACATTATAGCTGAAGGAGTGCAGTTTGATAAAGTGAGGAAGTGGAAACAGAGTGATCTCAAAGTGGATAATCTATTAAAAATCCTAGAAAGATTGAATGTGCGAAATTTGAAGACATCAGAAGAGGTTCACATAGATGTTGTCATTAAAATCCAAGACAAAACAGTCTACGCAACTCACATCAACCAGACGAGGTTCGAGTCTTGGAACGGATATGACTTGACGAAATCGATCACGGAGTTCCTGAGGTTCGGCAGTCACATAAACCAGCAAATAGCGTACTATCCCATTCAGATAGACGTCAATGTACCCAGCGATTTAGGCACACCCATCCGCCTTCAGTCGTCCGTGGTGACCTTCACTTCACTCCGCGGTAACCTCACCTCTAACCCGGACAGTGGACTCGCCCTGGATTGGGTTAACGATTTACATATACGCCATCAAGCGACTATAACAACAGCGCTATCAACAATCGCGCCGTTGCTGCAATCAGAACACGAAGTACGCGTCCAGCGTTCCGCGGTAGCGCATCTACCTATCAAATTTAACGTAACCATGGAACAATATGCTAAGTCTATAGCTTTAACCTGGTTGAACCCATTCGCTCAACGTGCCGGCTTCGCCATCCACTCTTGGATCCAAGTACACATGGACGCCAGGCAGCCTGATCTGTACACAGTCTCCAGTGGAATAACTACTGATGATGACAGTGGCATCTTCTTTGACTGTGAGAGAAAGACTTCAGGTGCTGAGGTGGTTGAGAAATATATAATGTCCAAGTTCATGAGCTACGATCTATTTCCAACCAAACATATTCTCAATACAATATCTCGGTTCATAACCTCTTGTGGGGTGATCATCCCTCCCAACCGACTAGTGGGAGGGGAAGACGAGATGGTTCACGTGGAATTTACGTTAGGAGACATTGTGTTCCAGAAAGTGGATAAGATAGAGATGGAATTTGACTTCATGTTGAAGTATTATAGTATAAATGATCCAAATAAACAGATATACTTAAAAATTGATTCAAATACTAAAATAAAAAGTGCGGGGAGGAATCTTTTTATCAAATGGTTCTTATACGTCAACCAGCCGTACTCCTTGGATCCGAAGAAGAAGTTTTGGAAGCTTTGTTATACCCAAAAAGACACGAGCCACGCCCCATCAGACCAAGATATCACCATCCATCCATCTTCCTACCATGGGACATCTAAAATATTGTATCAGACATCAGAAGAATACAACCAGTGTAATCCCAATGAGACAAGACCTAATGAATCTATTGAGACAAAACTTCAGTTGAACTACAAAGGAACGCCGAAAAACAACAGAGGCACCATCGAGAGATATGTCGAAGTCGACATTTTGGGGGAGAATTTGCATAATTTTGATCTACTGCATAATCTGGGCTACGGTGTCAAGACGCCCGTCGCTCAACTATTGGGAAGCTTCGATAAGAACAAAATTAACACTACGTCAGTTATTAAGGAAAAGGATGGTATAGCATCAATACGTGTGAATGGAGGCGTGGAGGTGGAGATGTACGTGGGAGGTCTGTCCTGGCTGCTCGATAGCTGGACCGCCATGCAACTGATGAGGAGGTTCGGGTTATACCGTGAATGTCGTCTTCAAGAGTCGACGGTCCAGATGTTGTCCGGATCCGTGGAACAGCTGCAACCCCTGCAGTGTTCGGAAAGCCTCGTCCTTGCGGATTGCTCTGTATCTCCAAGGTTCGTTATTCTCCGGAAACAAGATGGCGGTATCCAACTCTACGACGGAGATTATCCGTCCAAAAATGCGACGAGCGTACATTCTTCTAAAGTGACAGATTATAAGTCCATCTTGGAAGTTGGAACCAAAATCCTTTCGGAATCCACGGGTGTAGTGATGTATAAGAGATTAAATGAAAACGTTATTCTTTTACCATCTTCCTACATGCATTCTGTGTGTGGAGAATGCGCTGGTCATACAACGTATAACAATTGTTGA

Protein sequence:

>DPOGS215110-PA
MIYRCILLFAVLAPASATGIQMLFPDQKQYNYVVKTNISTGVAHRNSYWTLEGRLVVLVDDNYYATVQFKLEDLKTSVYSYNTGFSSYHTPEAARELEEPWKIIYQENGFISAIQHLPHERVWVTNIKRAISVNFQLKKDAGSYTNEEPCLYESCVMVYSVQGNTIKKYNSYQKASMTSQTSWSSVPWSGDYGRGVPENIATSQRVYDLDEKGLNCLNMKGLFEYIVDGHVLTVTTESVEEELQKSNQMGYEELQHELSCEISKYMNCDVSYTLKRLLPGDLKDNIEDATILSLIRKLPFNIANHSQALLEDMETISKLGLDFPQEIRHAGILSFAIMVSHCVEAMKVKQDYFDSILVKYFRMYSDCPQYLDRLIWLQGLCSLGYTSESYIRTIYADKTRNRHERLWASLACGQDTRGYNVLETSLPILMDDNEHIQLRISALHAILSSGIRESDFLFLHSWISTSRPELQRFWYSTVKSLESNKFPKYRTISDYIPFVSKDVVNPDSSLWGTNNYIVSGDELSGWVQVMTVGNPAPTLAALSVSTGGRRAYQASVYIIAEGVQFDKVRKWKQSDLKVDNLLKILERLNVRNLKTSEEVHIDVVIKIQDKTVYATHINQTRFESWNGYDLTKSITEFLRFGSHINQQIAYYPIQIDVNVPSDLGTPIRLQSSVVTFTSLRGNLTSNPDSGLALDWVNDLHIRHQATITTALSTIAPLLQSEHEVRVQRSAVAHLPIKFNVTMEQYAKSIALTWLNPFAQRAGFAIHSWIQVHMDARQPDLYTVSSGITTDDDSGIFFDCERKTSGAEVVEKYIMSKFMSYDLFPTKHILNTISRFITSCGVIIPPNRLVGGEDEMVHVEFTLGDIVFQKVDKIEMEFDFMLKYYSINDPNKQIYLKIDSNTKIKSAGRNLFIKWFLYVNQPYSLDPKKKFWKLCYTQKDTSHAPSDQDITIHPSSYHGTSKILYQTSEEYNQCNPNETRPNESIETKLQLNYKGTPKNNRGTIERYVEVDILGENLHNFDLLHNLGYGVKTPVAQLLGSFDKNKINTTSVIKEKDGIASIRVNGGVEVEMYVGGLSWLLDSWTAMQLMRRFGLYRECRLQESTVQMLSGSVEQLQPLQCSESLVLADCSVSPRFVILRKQDGGIQLYDGDYPSKNATSVHSSKVTDYKSILEVGTKILSESTGVVMYKRLNENVILLPSSYMHSVCGECAGHTTYNNC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: