MonarchBase - Protein-coding gene

DPOGS201819
Transcript	DPOGS201819-TA	2079 bp
Protein	DPOGS201819-PA	692 aa
Genomic position	DPSCF300145 + 323070-328744
RNAseq coverage	1271x (Rank: top 10%)

Annotation
*Heliconius*	HMEL008342	77.60%
*Bombyx*	BGIBMGA013115-TA	70.72%
*Drosophila*	CG8193-PA	50.66%
EBI UniRef50	UniRef50_D9J044	74.03%	Prophenoloxidase 2 n=4 Tax=Neoptera RepID=D9J044_PIERA
NCBI RefSeq	NP_001037534.1	70.72%	phenoloxidase subunit 2 precursor [Bombyx mori]
NCBI nr blastp	gi\|300390488	74.03%	prophenoloxidase 2 [Pieris rapae]
NCBI nr blastx	gi\|305430487	73.59%	prophenoloxidase [Pieris rapae]

Group
Gene Ontology	GO:0006810	1.6e-282	transport
	GO:0005344	1.6e-282	oxygen transporter activity
KEGG pathway	dme:Dmel_CG42640	0.0
	K00505 (E1.14.18.1)	maps->	Riboflavin metabolism
			Betalain biosynthesis
			Isoquinoline alkaloid biosynthesis
			Tyrosine metabolism
			Melanogenesis
InterPro domain	[1-684] IPR013788	1.6e-282	Arthropod hemocyanin/insect LSP
	[149-417] IPR008922	6.5e-97	Uncharacterised domain, di-copper centre
	[422-680] IPR005203	3.3e-90	Hemocyanin, C-terminal
	[422-681] IPR014756	1.7e-84	Immunoglobulin E-set
	[151-414] IPR000896	1e-56	Hemocyanin, copper-type
	[37-147] IPR005204	2.7e-26	Hemocyanin, N-terminal
Orthology group	MCL10066		Insect specific

Nucleotide sequence:

>DPOGS201819-TA
ATGGCGAACATTGTTACAGCTTTGAAGTTGTTGTTTGACCGTCCTAATGAACCCATGGTTTCACCCAAGGGTGACAATCAAGTTGTCTTTCAACTCACAGAACAGCATCTCGACGATAAATACAAGAGCAATGGCATCGAGATCAATAATCGTTTTGGGAAGGACAAACCAATTATCCCGTTAAAGGAACTAAAGACACTTCCTCAGTTTCCAAAAGCTAAACGGCTGCCAAGCGATGCCGATTTCTCTATTCTTCTGCCTGCCCACCAGGAGATGGCTGATGAGGTCATTGATGCCCTTCTAGCGGTGCCTGAAAACCAACTACCCGAATTTCTATCGACATGCGTTTATGCGCGTGTGAATCTGAATCCTCAGTTATTTAACTACTGCTACTCTGTGGCTTTGTTGCACAGGAAGGACACTAAAAATGTTCCACTTCAAAACTTCGCTGAGACCTTCCCGTCTAAGTTCGTTGATTCGAAGTTTTTCAGTCAAGCACGCGAATCCGCCGCCCTTGCCAAACAAGGAGCTCCGCGTGTGCCAATAATAATCCCGCGCGACTTTACCGCAAACGACTTAGACATTGAACACAGACTCGCTTACTGGCGCGAAGACATCGGAATCAACCTTCACCACTGGCATTGGCATCTGGTGTACCCATTCAGCGCAACTAAAAGAGAAATTGTGGCTAAGGACCGTCGTGGCGAACTCTTCTTCTACATGCACCAGCAAGTCATAGCCCGATACAACACGGAACGCCTGGCTAACCAGCTCGCACGTGCTAAGAAGTTCAGTGACTTCACGGAACCGACTCCTGAGCCGTACTATCCTAAATTGGACAGTCTCACATCGTCCCGCAGCTACCCGCCGCGGCAGGCCAACATGAGGTGGTCGGATCTCAACAGGCCCGTCGATGGTCTCGTGGTCACCATCGCCGATATGAACCGCTGGAAGAGGAACCTCGAAGAGGCCATCGCCACGGGCATGGTCAAACTGCCAAATGGCTCGACCCAGCCCCTGGACATAGACACTCTGGGGAACATGGTGGAGTCGAGCATACTGTCACCGAACAGAGATTACTACGGAACCTTGCACAACAACGGACACAGCTTCGCTGGATACTTGCACGATCCTGACCACAGATATCTGGAATCCTTCAACGTAATAGCTGACGAGGCGGTGAATATGCGAGATCCCTTCTTCTACCGCTGGCACGCGTTCATTGACGACCTTTTCCAGAAGTTCAAAGAGAGCAACAACGTGAGACGATACACGAGATCGGAGCTTTCGAACCCGGGGGTGCAAATCACGAATGCCAAGATCGTGAACAGCAATGGCGCCGCGGACAACACTCTACACACGTACTGGATGCAAAGCGACGTCGATCTGTCGCGCGGACTCGACTTCTCGGACCGCGGGCCGGTGTACGCGAGGTTCACTCACCTCAACTACAGGCCGTTCAGATATGTCATCGACGTAGACAACACGGGCAGCGCTCGCCGGACAACGGTCCGCATCTTCATAGCCCCCAAGTTTGATGAACGTGGCTTGCCGTGGATACTATCCGACCAACGCAAAATGTTCATCGAGATGGACAGATTCGTTGTGCCCTTGAACGCCGGCAAGAATGTCATAACACGTGAGTCTACCGAATCCTCGCTGACTATCCCCTTCGAGCAGACCTTCCGCGACCTCTCCAGCCAGGGAAGCGACCCTCGACGTGAGGACCTCGCTAGCTTCAATTTCTGCGGCTGTGGGTGGCCCCAACACATGCTTGTACCACGTGGCACTGAGAGCGGCATGCTGTTTGACTTTTTCGTTATGCTGTCAAACTACGACCTTGACGCCATAACTCAACCAGAAGGTGTTGCACCGCTGTCCTGTACAGAAGCTTCTAGCTTCTGTGGTCTGAAGGATCGTCTTTACCCCGACAAGCGCAACATGGGCTTCCCATTTGACAGACCTTCCAGCAGCGCTGCAAACATCCAGGACTTCATTCTGCCAAACATGTTCCTTGCTGATGTTAGCATTCGTCTACAAAACACCGTGGAAATAAATCCCAGAAATGCTAAAAACTAA

Protein sequence:

>DPOGS201819-PA
MANIVTALKLLFDRPNEPMVSPKGDNQVVFQLTEQHLDDKYKSNGIEINNRFGKDKPIIPLKELKTLPQFPKAKRLPSDADFSILLPAHQEMADEVIDALLAVPENQLPEFLSTCVYARVNLNPQLFNYCYSVALLHRKDTKNVPLQNFAETFPSKFVDSKFFSQARESAALAKQGAPRVPIIIPRDFTANDLDIEHRLAYWREDIGINLHHWHWHLVYPFSATKREIVAKDRRGELFFYMHQQVIARYNTERLANQLARAKKFSDFTEPTPEPYYPKLDSLTSSRSYPPRQANMRWSDLNRPVDGLVVTIADMNRWKRNLEEAIATGMVKLPNGSTQPLDIDTLGNMVESSILSPNRDYYGTLHNNGHSFAGYLHDPDHRYLESFNVIADEAVNMRDPFFYRWHAFIDDLFQKFKESNNVRRYTRSELSNPGVQITNAKIVNSNGAADNTLHTYWMQSDVDLSRGLDFSDRGPVYARFTHLNYRPFRYVIDVDNTGSARRTTVRIFIAPKFDERGLPWILSDQRKMFIEMDRFVVPLNAGKNVITRESTESSLTIPFEQTFRDLSSQGSDPRREDLASFNFCGCGWPQHMLVPRGTESGMLFDFFVMLSNYDLDAITQPEGVAPLSCTEASSFCGLKDRLYPDKRNMGFPFDRPSSSAANIQDFILPNMFLADVSIRLQNTVEINPRNAKN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: