MonarchBase - Protein-coding gene

DPOGS210671
Transcript	DPOGS210671-TA	1956 bp
Protein	DPOGS210671-PA	651 aa
Genomic position	DPSCF300013 - 1518805-1551296
RNAseq coverage	78x (Rank: top 65%)

Annotation
*Heliconius*	HMEL022205	2e-111	62.46%
*Bombyx*	BGIBMGA006252-TA	6e-85	68.44%
*Drosophila*	CG34402-PC	1e-69	29.34%
EBI UniRef50	UniRef50_D6X3G8	9e-90	55.23%	Putative uncharacterized protein n=4 Tax=Endopterygota RepID=D6X3G8_TRICA
NCBI RefSeq	XP_002425273.1	3e-82	54.72%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastp	gi\|328783696	1e-173	51.78%	PREDICTED: cubilin-like [Apis mellifera]
NCBI nr blastx	gi\|328783696	5e-175	51.33%	PREDICTED: cubilin-like [Apis mellifera]

Group
KEGG pathway
InterPro domain	[199-321] IPR000859	1.2e-26	CUB
Orthology group	MCL10438		Insect specific

Nucleotide sequence:

>DPOGS210671-TA
ATGGCTATGTCTAAATTATATCGTGCTGGGAACTGTAAATACAACATGCAACCGGGAAACTTACACACAATGAAGACATCAACAGCCCTGATGCTGTTAGTCCACTTATCGCTTCACACGGTTGATGAGGGCCACGCAATAAATCCGAGCTGCACCTGCGTACATTTTACGTCCACTCACGGCAAAGAAAGGGGAACTTTCAGCAGTCCAGATTACCCTCGTCCTTACCCTCAGAACGCATGTTTACTTTACACGTTTCTTGCTGAAGCTCACCAGATTGTTGAACTTGTCTTCACGGACTTTGACATTTACAAGGAACACATGGATTGCAGCAATGGAAACTATCTAAAAGTATATTCGGAGGTTGAAATACATGGTCCCGGCCCTCCCGGTATTAACGAATTTTCAGTCTGGTCCAGGATTCTATGTGGAAATCGTGCTGAAGCACCACCGCCGCTATATTCTCATGGACCAATAATGATATTAGAATTTCAAAGTGGAGAGAAACCTTCCAATGCTTCTGGCTTTATTGGAACATACAGGTTTATCGATCGACGTAACTTTGAGACGGATGGTGTTAAAGTATCGGGGACACAGTGTGATTATGTATTTGCATCGCAAGCAGAGCGTCCTAGTCATGGACGACTATATAGTCCAAGATATCCTTCCAGTTATCCTAATAGCGTTAGGTGCAATTATCATTTTAATGCAAGAAAAAATGAAAGAATAAAATTAGTTTTTGAAGAATTATATCTACAGAAAGGCGATGTAAGTTGTCTTAACCGCGGTGATGTGATCAAAGTTTTTGATGGGAGAAATTCAGTAGCACCAGTCATTTCAATGCTTTGTAATGAAATTGTAGGATATGAAATCCTTTCAACGGGACCAGAGCTTTTAGTGCAGTTCTCATCAAATTCCAAAACACCCGGACAAGGATTTAAAGCAAGTTACCAGTTTCTAGCGAAGGACGCCTCTAGTGCAGAAACTGAAGGTAACAAAAAGCCAAGTGCAATGGATGGTTATTCTTCTGTTGGACCAGCTGTTAGCGCAACCACGTCATCCTGTCATCAAGTATTCAGATCTGATAAGAGCAGAAGCGGCAAATTGATCTCGCCGTTATACCCTTCGCCGTACCCTCAAAAGACGCAATGTCATTATGACTTTCTCGCGAAAGGGCGGGAACGCGTGCGATTAGTCTTTGAAGACTTTAATCTACAACGAGCCAGCAGTATTAGCGACTGCGAGAGTATGGACTCATTTGACGTCTTTTTGTATGTGGACGGTCGACTCGAGAAAATGGCGTCATATTGTGGCAATGACGTACCGAAGCCAATAATGTCGAATGGTCCAAAGTTGTCCATCGAGTTTAGGGGTATATACTCGTCAAGATACAGCAGAGGTTTTAAGATAGCGTACTATTTTGTTGAAGATTATGCAATCGCTACGGGAAAGCAGCTTTTAGAGTATCCATGTGCCTTCGTATATAATATCACGGATCGACGAAAAGGGGTTATGACGTCACCAAATTATCCGGGCCTCTACCCTAGGGACACTGAGTGCAATTACTTCTTCCACGCTCGAAAGAACGAGAGAGTGCATCTTAAGTTCTCACACTTTGACGTTGAGGGAGTTGTACCATGCGAAGCTGTCTCGGCGAGTGACTACGTGCAATTCTCTAGTCAAATGATAGATATAGATAGTCAAAGATACTGTGGTCAATTGAGAGAGCTGGATGTTGTATCAAAGAGTAATTTCCTGAGGGTCACCTTCCGTTCCAACGACAGACTGGATGGAACTGGTTTCAAAGCTGAATATATTTTTCTGAAGGACTCTGAAATGCGCAGTGTCAAATCTGAAACAAATGGTTCTGTTGGACTTCACATTAAAAAAGATCATCTATGGAGGAACTTCTTTAGACTGTTGTTAGCTTTGAGCATAGTTACAATAGTATTATAG

Protein sequence:

>DPOGS210671-PA
MAMSKLYRAGNCKYNMQPGNLHTMKTSTALMLLVHLSLHTVDEGHAINPSCTCVHFTSTHGKERGTFSSPDYPRPYPQNACLLYTFLAEAHQIVELVFTDFDIYKEHMDCSNGNYLKVYSEVEIHGPGPPGINEFSVWSRILCGNRAEAPPPLYSHGPIMILEFQSGEKPSNASGFIGTYRFIDRRNFETDGVKVSGTQCDYVFASQAERPSHGRLYSPRYPSSYPNSVRCNYHFNARKNERIKLVFEELYLQKGDVSCLNRGDVIKVFDGRNSVAPVISMLCNEIVGYEILSTGPELLVQFSSNSKTPGQGFKASYQFLAKDASSAETEGNKKPSAMDGYSSVGPAVSATTSSCHQVFRSDKSRSGKLISPLYPSPYPQKTQCHYDFLAKGRERVRLVFEDFNLQRASSISDCESMDSFDVFLYVDGRLEKMASYCGNDVPKPIMSNGPKLSIEFRGIYSSRYSRGFKIAYYFVEDYAIATGKQLLEYPCAFVYNITDRRKGVMTSPNYPGLYPRDTECNYFFHARKNERVHLKFSHFDVEGVVPCEAVSASDYVQFSSQMIDIDSQRYCGQLRELDVVSKSNFLRVTFRSNDRLDGTGFKAEYIFLKDSEMRSVKSETNGSVGLHIKKDHLWRNFFRLLLALSIVTIVL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: