MonarchBase - Protein-coding gene

DPOGS206478
Transcript	DPOGS206478-TA	3342 bp
Protein	DPOGS206478-PA	1113 aa
Genomic position	DPSCF300070 + 545677-563193
RNAseq coverage	24x (Rank: top 78%)

Annotation
*Heliconius*	HMEL012714	0.0	91.56%
*Bombyx*	BGIBMGA005365-TA	0.0	87.40%
*Drosophila*	CG32432-PA	2e-105	30.88%
EBI UniRef50	UniRef50_E2AVC0	0.0	50.60%	Cubilin n=5 Tax=Formicidae RepID=E2AVC0_CAMFO
NCBI RefSeq	XP_968153.1	0.0	46.79%	PREDICTED: similar to CG32432 CG32432-PA [Tribolium castaneum]
NCBI nr blastp	gi\|380015699	0.0	52.81%	PREDICTED: uncharacterized protein LOC100869581 [Apis florea]
NCBI nr blastx	gi\|380015699	0.0	52.96%	PREDICTED: uncharacterized protein LOC100869581 [Apis florea]

Group
Gene Ontology	GO:0005515	1.2e-09	protein binding
KEGG pathway
InterPro domain	[255-400] IPR000859	4e-17	CUB
	[63-101] IPR002172	1.2e-09	Low-density lipoprotein (LDL) receptor class A repeat
Orthology group	MCL10279		Insect specific

Nucleotide sequence:

>DPOGS206478-TA
ATGGATTTGTTAAGAAATATCTATTGTATCTCAAATTATAATAGAACTATATTTTTCATGATAGTTTTGTTTTCTTTCAAACTGTGTAGACCTCAGGACTTAAGTGAAGACTTTATTAATGAGGATAGTTTAGACTCTGATATTATGTTACCGGTGAAAGTTAAGGCGAGAAATGTGGCAGAGAGTCCGTGTAGACTGAGCGAACTGCTATGTGATACGGGACAGTGTATATCGATGGATAAGTACTGTAATAGAGAAGATGACTGCGGAGATAAAAGCGATGAACCAAAATCGTGTACACCTTGTAACAGAACATACATGGGAGATGTCGGCCGTACTTACGAACTGGAGGTTCGTAGGCCGAGAGAGGATCATCTTCCATTTGTCTGTCATCTAAATTTTACTGCTAATGGCGGCAACTATGGCGATATTATACAGCTTACATTCGACACTTTCACGGTGGGTAAATTTGTATCGTTTACTTCTGATGGATGTCCGGATGGACACATGACAATAGTTGAGAGAAGTTCATCACCACCGATGGGTCAATGGTGTGGCTCAGCATGGGGTTATACTGTATACTTTAGCGAATCAGACTCTATAAATATGACTCTCCGTTTGGATAGACTGAGCCAGCAGGGTGTTGGGTACAATTTCGACTTCAAGTTGGCATACAAGTTTCTAAGACGAAGCGAAGCTAGATTGCGGTACGGTAACGCGACTGTGGGGGCATGGAGGGGGGAACGAGTCTCTGGCACCTATTGCGACCGCATACTGAGCGACTGTGATCTACGCGCATGCCGCATCCAGTCACCAAACTTTCCTGGAGTATATCCACGTAATGCGACGTGTACATACCGCATTGAACACACAAAGATACCAGCAGATAAACATGTTCTTTTGGCCGTAAGACAAACAAATAGTCACAAAATACATATCAAAGATCAAATAGTCAAATATGATAGAAGCCAACGAGTTTTAAAGATTTGGGACCAATGTAATGTCGTTCAGGATTATCTAACAGTTTGGGATGGACCTACAAGAGACTATCCGGTTCTAGTTAGACTTTGTGGAGGAGACGCAGTTCCTGACATAGTTAGCAGAGGGCCTAATATGTTACTAGAGTTTCATACCTCACCTTATGATAATCCTTTTCATCCAGTTCCGCTCAGTTATTTACCTGGTTTTGAGCTTGAAGTTCAGGTGTTGTACGTGGACAGAGATTCCCATTCGTACGTGAGTTCAGATGGTCGTTGTCGGTTTGTTTTACGCTCCTCTGACAAGACAAGCGGGGTGTTAAGAAATCCACGACACTCCTTGCCACCAAATACATCTTGTGTGTATTACTTTCAAGGTCGTCCAAACGAAATAGTATGGGTATCGTTTGTTAAGTACCACGCTGCGGGTTCGGAGCCGGCGGGATTCGATCAACAAAAGGATTGCTCTTCACAACTCACTATTTGGGATGGTGCGGCACCTGATGCAGATCTTGATAGAAAGTTGGAAATGAGTGACAAGAAATCTCTTCTCGGTTCATTTTGTCGAGAGGAATCTCCGCGTCTGTGTGACCATGCGCTTCTATCAAACGCTACGCGCGCCACCAGGCCTTGTGCTCCCACAGAAAGCTACATCACAACAGGACCAGCGCTTACTATTTTGCAGGAGCTACGTCAAGGTTCAGCATTATATCCTGTCTCTTTCGTCTTGCGATACGAATTCGTAGATGTGAGTGAGCAAGGTCAACCATTAGTGGACTCTCAGTCAGCGTGTGATAGAGTTTTTAAGTCAGCACTCACATATTCTGGAAGATTTCAAGCTCCCCGAGCTATATTTTACTATGGGCGAGGTGGATCTCAAAATTTGACTTGTATTTTAAGATTTGAAGCTAAGCATGGAGAAAGAATACAGTTAACGTTTACAAACACATATTTTGGAAATAAAATTTGTAGTACTCATAAAGATTCCAAGACAAGCCGATGGGTTTGTGATAGGCCAATTAAAAGAATAATAGGTGGGGAAGGTTTAGCTCAGATTATTATAACTGAATATCCTTGGGAAGGGATCCCTATACAAAGAGATTGTTTATGTACAAATCGCTCCGAACCTCTTAACGTTCACACGCTTACAGCTCCCGTCGTAGAAGTTAATTTTACTGTGACTATGATGAACATAACTGAAGATTATGACGATTTTCAATTTGAAGGTGAATATAAATTTATTCCCACTGGCCCCGGAGACGAAAGTGTTTGTTCTACTGGTTGGGGTGATAGACGATTAAGAGGAAGCAGTGGGGAAATAAGATTGTATGACAACAGAGAAGCGTCTGTAACTCCAGAAATAATGGGTGACAGAAATGTTATATCAGAAAGCGTCAGAGCAGAAGTTGCTTGTGTTCATAGACCTTGGTTGATAGAACCTGGAGGGGATGATGTAACACCTTTACAGGGTAGATATCTATATATCAAAGTACCGGGATATGAAATAACGCCTACCTCACCATTTTGTCCTACACCAAATCGACTATTTATATACGAAGCACGAGATACTTCAATTCACAGAGAAATTTGTCCTAAAGATTCTAACACTTTAGATTTGTATTCGCCAGGATGGAAATCATCACAAACAACAATAGAATCATCATTAAAACCTCATGCTAAGAGCTACGTAATTGATTTTCTACAACACGAACAAACCGATTACTCAATCAAATGGATAGAAGTTATGAAAAAGCCATCTATTGACCATGATCCAGGGTCAAACATTTTGCCTTTATCGGTTAATTTAGATTGCCATCATAACTGCCCAGAGTTGAATGCCTGTATTCCTATTACATTATGGTGTGATGGCAGTCCTCATTGCCCTTCTGGTTACGATGAAGATGACTCAAACTGTTCTTTTAAGTTGTCCTTGCCGTCACCATATGTTGCGGCAGTGGCCGGTATGGGACTTCTTATTTGTGCTATCGCAATTGGTTTATGTGCATGTAAACGACGAAGAAAAAAAGATAAGGAGTTTAAGGCAAGACTCGACGACGCGCTTCCACCTGAAGAAAGACCTTATGATCGTTCAAAAAGTAATGGCGTTCCAGAAGCTAATCGTCAATACGCAACTGTACAAAAATATGCTACAATAGATAAATACAGTTTAAGTCAAAAATATAGTGCGGGGCTCAATGATGTTAGGTATTATGATGAAGTAGCTCAAAAAGATAAGCTAGCCGACACGAGGTATGCTAGCTTAGGGCGCGCTGGTCGGTGTAATCGAATGGAAAATAATAGAGGCACTGGATCTAGAAGAATGCCAGACGTAGGCTATCCAGATCTAAAAGACGGATTTTGTTGA

Protein sequence:

>DPOGS206478-PA
MDLLRNIYCISNYNRTIFFMIVLFSFKLCRPQDLSEDFINEDSLDSDIMLPVKVKARNVAESPCRLSELLCDTGQCISMDKYCNREDDCGDKSDEPKSCTPCNRTYMGDVGRTYELEVRRPREDHLPFVCHLNFTANGGNYGDIIQLTFDTFTVGKFVSFTSDGCPDGHMTIVERSSSPPMGQWCGSAWGYTVYFSESDSINMTLRLDRLSQQGVGYNFDFKLAYKFLRRSEARLRYGNATVGAWRGERVSGTYCDRILSDCDLRACRIQSPNFPGVYPRNATCTYRIEHTKIPADKHVLLAVRQTNSHKIHIKDQIVKYDRSQRVLKIWDQCNVVQDYLTVWDGPTRDYPVLVRLCGGDAVPDIVSRGPNMLLEFHTSPYDNPFHPVPLSYLPGFELEVQVLYVDRDSHSYVSSDGRCRFVLRSSDKTSGVLRNPRHSLPPNTSCVYYFQGRPNEIVWVSFVKYHAAGSEPAGFDQQKDCSSQLTIWDGAAPDADLDRKLEMSDKKSLLGSFCREESPRLCDHALLSNATRATRPCAPTESYITTGPALTILQELRQGSALYPVSFVLRYEFVDVSEQGQPLVDSQSACDRVFKSALTYSGRFQAPRAIFYYGRGGSQNLTCILRFEAKHGERIQLTFTNTYFGNKICSTHKDSKTSRWVCDRPIKRIIGGEGLAQIIITEYPWEGIPIQRDCLCTNRSEPLNVHTLTAPVVEVNFTVTMMNITEDYDDFQFEGEYKFIPTGPGDESVCSTGWGDRRLRGSSGEIRLYDNREASVTPEIMGDRNVISESVRAEVACVHRPWLIEPGGDDVTPLQGRYLYIKVPGYEITPTSPFCPTPNRLFIYEARDTSIHREICPKDSNTLDLYSPGWKSSQTTIESSLKPHAKSYVIDFLQHEQTDYSIKWIEVMKKPSIDHDPGSNILPLSVNLDCHHNCPELNACIPITLWCDGSPHCPSGYDEDDSNCSFKLSLPSPYVAAVAGMGLLICAIAIGLCACKRRRKKDKEFKARLDDALPPEERPYDRSKSNGVPEANRQYATVQKYATIDKYSLSQKYSAGLNDVRYYDEVAQKDKLADTRYASLGRAGRCNRMENNRGTGSRRMPDVGYPDLKDGFC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: