MonarchBase - Protein-coding gene

DPOGS203780
Transcript	DPOGS203780-TA	3279 bp
Protein	DPOGS203780-PA	1092 aa
Genomic position	DPSCF300010 + 810298-833788
RNAseq coverage	16x (Rank: top 81%)

Annotation
*Heliconius*	HMEL008526	0.0	88.95%
*Bombyx*	BGIBMGA003526-TA	0.0	78.93%
*Drosophila*	CG34370-PG	8e-12	25.76%
EBI UniRef50	UniRef50_UPI00020624F1	0.0	43.15%	UPI00020624F1 related cluster n=1 Tax=unknown RepID=UPI00020624F1
NCBI RefSeq	XP_002428475.1	3e-139	38.27%	hypothetical protein Phum_PHUM383910 [Pediculus humanus corporis]
NCBI nr blastp	gi\|328721721	0.0	43.15%	PREDICTED: hypothetical protein LOC100572104 [Acyrthosiphon pisum]
NCBI nr blastx	gi\|328721721	0.0	43.27%	PREDICTED: hypothetical protein LOC100572104 [Acyrthosiphon pisum]

Group
KEGG pathway
InterPro domain	[242-352] IPR000859	3.9e-15	CUB
Orthology group	MCL17761		Insect specific

Nucleotide sequence:

>DPOGS203780-TA
ATGCGGCAAGCGGTTGCGTTGCTACTTACCGCATGTGCTGTCTCTGCACAGATTGCGTGGACACCTATATTCTTAGATGGCAGCAGTCAAGTCGATCTGTGGACGCAATCATCATCAGGTTGTGCATGCCCAGGTCAAGGAGGAGAAGAGTGCGCCTGTTGCGTGCGTGACGGAGCATGTCCCTGTGGGGATTTTGCTCCCGGAAGATGCGCTCAATGTGGACTTGAACAATTTTGTTCGAATATGTGCAATATGACTATTGACTCGCGAGTGCTCAAGAATAAGTCTGGCAAAACTTTCGGCCAGATCAAATCTCCATCCATAGAGGGTCCCAGCACATGTTCCTACATTCTTCAGCCCGATGCAGGGCAGCGAGTTGAAATTCAAGTGTATCGCCTTGTTTCTGTTGGGAGATACAACGGGTCCAGTTGTGTAGGTGGATGGTTGCAACTGAGTGGTGCCAGTGCCGTGCAGGATGCCAGTGGCGCAGCTGACACTAGATTGTGTGGTACTAACGAACGGTATACACCTCCCGTTGTATTATTTGCTGACCACGGCGCTGCTGCTCTTGATTTTAGGATAACTGAGAAGACTGAAAGATCCCAGTTCCTGGCTTTCTTCAGTTTTACATCTTTAAGCAATACACAGGGCGTTGGTTTCCATCCCAGAGGTGGCTCCAGAATTCCTAATACAGATTGTGACTGGTTGTACCAAGACGTCTCGTGTCGTGGCAGCGGTACATGTGTGTTAGCAAGTCCTGGATATCCTGGCCTGTACCCTCCACATCGTCGATGCCGATATCTCTTTGCTACAAACTCGGTACACACCAGGGTCAAAATTATATTTACATCTATATTGCTACCTAAGAACCATTGTACTACGGACTATTTAACGCTCCGGGCTGGCAGTTCGCCGTCAGCACCACTTCTCGCTTCACTCTGCTCTGAAAGAAGCGCAACTTTAGAACATCCTGGGCCAAATTTGTTACTGGAATTCAATTCTGGGCCTTTGGTATCACCATATGACTACAATGGCTTCATTGCGAAGTTAGAATTCCTTGAAAAAATAGAAGAAAATTTTCTCGCACCTACGATACCTGCTGCGCCACCACTCGCTGCGCTCACACATTTTACATATGGGGAAAGTAATGTAGCAATCGATAACGATGCAACATCAAACGAAATATCAAATAATAATGGACGTATAGGATGTGGTGCAACCGTTCGTGGTTTTGGAGCGGGCGTAATAAGATCAGGACATTTTGATACAAGAGCAACGACATGGCGAGCACAATGTATAATACATTTACTTGGAATGCCGACGGATGTGGTTCAAGTATCTCTATTTAATTATAATTTAAGGTTACAAGGTTGCAGATCTCATATTGAGGTCTTGGAAGGTGTTCATGAATATGGATTGAAAGGGGATAAAGGGGATAGATATGAAAGAGGAGACAGAGCCCTCCTAAGGATATGTGGTCCTTCTGTAAGAGAAGCAAGAGATCCTTCGGGAAGGTTTTTAGTAAGACAGGCCGTTACATCTAAGAGTTCAAACTTAACCATATTAGTGAGAAGAGCTACAACCCAAAGTGTCGACGAAGAGGAATTTGTGGATGGTGCCTTCTCATTTCATGACGAACAGCATGAGGGTACGGTTTCACCCGATGCTACATGTGCATCCACACACTACGGCCTTGCTGCGCCGGTGCATGGTGGGGTTTCAGCTCCTTCACATCATCACATTTTTTGGAATATTGAGGAGAGACTTATGTGCACTCATCGGTTTATACCAGCATCCAATCAAAGTGTTACAATCGAGATCCAAAGGTTGGAGCGTATGTGGAGCGCTGAACCAACTGGAAGTGTGGTAACCGGAACTGGTGGCTGTCGCACCGCTTGTGGTGATGCTGGTTGTGAATGTCGCGCCAACACACCACTTCGATACCACGACCACGTGGCACTTGTGGCGGGCGATGGTACACACTTGTCCTGTCTTTGTGGCGATTTCCAGGCTGCTTGGCTGCCTGTTGTAGTTAGGAGCTGGACGAGCTTGCGCTTGGAGTATTCAGTCGCCCACTACACGTACGCGAGCCGAGGATTTGATTATGCTGCTGCATATAGCTTTAATGACGATGCTATGTGTGGTCAACGCACGTACACTACACATTCTGGGGAGATTTCGTCGAAGAATGTTTCCGTTACGGGCAGTTTAAATGAATTTTTTTATCAACAATGTACTTGGGTGTTGGACTCTAATGTTGAACGACAACTTTACATTGATATATGGTCAGAACAGGATAAGTCGTGCAGCTCGTGGAATATTACACTTCACGAATGGTCGGGCATGGGGGCGCACAGTGAAGGCGGGCTGGCGGCATCGGCTGGCGATCTACTTTATACCTTCTGTGCTCGTCATAAGAACCATACATACACGCTACCCTGGAGACTCAACACAGTTGTTATTAGCTCGAGGTATGAAATGGGTTTGCTTGTTCCCGTTGGTCATAAACATGGCGTAACTGGCGGTATGTCATCTGCCGCCTCGGTTATTAGAGGCATGAGGTCGCTCGACGCGACAGCCCACAAACTTACCCTTCAAAATTCAATTACTTATTTGGCAACGTTCAAATTAGAAGCGGATGCTGCTTGGCTGCCTGTTGTAGTTAGGAGCTGGACGAGCTTGCGCTTGGAGTATTCAGTCGCCCACTACACGTACGCGAGCCGAGGATTTGATTATGCTGCTGCATATAGCTTTAATGACGATGCTATGTGTGGTCAACGCACGTACACTACACATTCTGGGGAGATTTCGTCGAAGAATGTTTCCGTTACGGGCAGTTTAAATGAATTTTTTTATCAACAATGTACTTGGGTGTTGGACTCTAATGTTGAACGACAACTTTACATTGATATATGGTCAGAACAGGATAAGTCGTGCAGCTCGTGGAATATTACACTTCACGAATGGTCGGGCATGGGGGCGCACAGTGAAGGCGGGCTGGCGGCATCGGCTGGCGATCTACTTTATACCTTCTGTGCTCGTCATAAGAACCATACATACACGCTACCCTGGAGACTCAACACAGTTGTTATTAGATTAGTTGCACTATCACGACAACAACCATTATATACAATCCGATGGCGGTCACAAGTAGTGCGGGCTAACAGGCCCAGTCCGCCCACTCCAGCCCCCGCAGCAGCAGCCATCGCCTCCAATCTCGCGCCATATAATGTTATTTTAATTTTATTGGCGCTTACACGATACGTAAACACCACCTGA

Protein sequence:

>DPOGS203780-PA
MRQAVALLLTACAVSAQIAWTPIFLDGSSQVDLWTQSSSGCACPGQGGEECACCVRDGACPCGDFAPGRCAQCGLEQFCSNMCNMTIDSRVLKNKSGKTFGQIKSPSIEGPSTCSYILQPDAGQRVEIQVYRLVSVGRYNGSSCVGGWLQLSGASAVQDASGAADTRLCGTNERYTPPVVLFADHGAAALDFRITEKTERSQFLAFFSFTSLSNTQGVGFHPRGGSRIPNTDCDWLYQDVSCRGSGTCVLASPGYPGLYPPHRRCRYLFATNSVHTRVKIIFTSILLPKNHCTTDYLTLRAGSSPSAPLLASLCSERSATLEHPGPNLLLEFNSGPLVSPYDYNGFIAKLEFLEKIEENFLAPTIPAAPPLAALTHFTYGESNVAIDNDATSNEISNNNGRIGCGATVRGFGAGVIRSGHFDTRATTWRAQCIIHLLGMPTDVVQVSLFNYNLRLQGCRSHIEVLEGVHEYGLKGDKGDRYERGDRALLRICGPSVREARDPSGRFLVRQAVTSKSSNLTILVRRATTQSVDEEEFVDGAFSFHDEQHEGTVSPDATCASTHYGLAAPVHGGVSAPSHHHIFWNIEERLMCTHRFIPASNQSVTIEIQRLERMWSAEPTGSVVTGTGGCRTACGDAGCECRANTPLRYHDHVALVAGDGTHLSCLCGDFQAAWLPVVVRSWTSLRLEYSVAHYTYASRGFDYAAAYSFNDDAMCGQRTYTTHSGEISSKNVSVTGSLNEFFYQQCTWVLDSNVERQLYIDIWSEQDKSCSSWNITLHEWSGMGAHSEGGLAASAGDLLYTFCARHKNHTYTLPWRLNTVVISSRYEMGLLVPVGHKHGVTGGMSSAASVIRGMRSLDATAHKLTLQNSITYLATFKLEADAAWLPVVVRSWTSLRLEYSVAHYTYASRGFDYAAAYSFNDDAMCGQRTYTTHSGEISSKNVSVTGSLNEFFYQQCTWVLDSNVERQLYIDIWSEQDKSCSSWNITLHEWSGMGAHSEGGLAASAGDLLYTFCARHKNHTYTLPWRLNTVVIRLVALSRQQPLYTIRWRSQVVRANRPSPPTPAPAAAAIASNLAPYNVILILLALTRYVNTT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: