MonarchBase - Protein-coding gene

DPOGS201044
Transcript	DPOGS201044-TA	1338 bp
Protein	DPOGS201044-PA	445 aa
Genomic position	DPSCF300299 + 52598-57845
RNAseq coverage	1x (Rank: top 93%)

Annotation
*Heliconius*	HMEL005364	1e-115	69.12%
*Bombyx*	BGIBMGA012487-TA	8e-171	61.42%
*Drosophila*	CG17928-PA	1e-87	39.77%
EBI UniRef50	UniRef50_D6WVJ2	2e-106	46.21%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WVJ2_TRICA
NCBI RefSeq	XP_975884.1	4e-107	46.21%	PREDICTED: similar to CG17928 CG17928-PA isoform 2 [Tribolium castaneum]
NCBI nr blastp	gi\|91088131	8e-106	46.21%	PREDICTED: similar to CG17928 CG17928-PA isoform 2 [Tribolium castaneum]
NCBI nr blastx	gi\|91088131	7e-107	46.32%	PREDICTED: similar to CG17928 CG17928-PA isoform 2 [Tribolium castaneum]

Group
Gene Ontology	GO:0006629	1.5e-18	lipid metabolic process
	GO:0020037	3e-18	heme binding
KEGG pathway
InterPro domain	[170-410] IPR005804	1.5e-18	Fatty acid desaturase, type 1
	[19-122] IPR001199	3e-18	Cytochrome b5
Orthology group	MCL19867		Insect specific

Nucleotide sequence:

>DPOGS201044-TA
ATGGCACCTGATCCAGAAAGACGGCAAGTGAGTTTTCCGAAACTAAAATATCCTTTGTTCAGAGAAGAAGAGCCAAAGAGTCCACAAAAATGGATAAAAGCGAAACAGATTCAAGATGGCGCCGAAGGTTTCTGGAGAATTCATGACAATATTTACGATCTCACCGAATTTATTCCTTCTCATCCTGGGGGCTCGCAGTGGCTTTCAATGACCAAGGGTACAGATATTACCGAAGCCTTTGAAACACATCACATAAACAGTACAGCCGAAGCTCTGTTACCCAAATATTTTATTAAGAAAGCCGACACCCCACGGAATTCACCCTTTACGTTTAAGGAAGATGGGTTTTATAAGACATTGAAAGCAAAAGTCGTGTTAAAATTAAAAGACATACCAGGCGACGTAAGGAAAAAGAGTGACAATGTAACAGATTTTCTCTTTGTATGCCTCGTGGTAGCTGGTCCGCTTTGTTGTTGGCTTTGGACAAAGAATTTAATATATGGAGCGGCCGCCACGCTGATTCTCGGTCTAACACTTTGTGCCTTAACAATCTGTGCCCACAACTATTTTCATAGAGCAGATAGCTGGCGGATGTACCTTTTCAATATAAGCGGCTTCTCATACCTTGATTGGCGGATTTCACACTCGATGTCTCATCACTTATACACAAACACAGCAAACGATATAGAATTGAGCTTCTTAGAGCCTTTCTTGCAATACTTGCCGAGGCCGGATAAGCCATTATGGGCCCAAATGGGGGCTTTCTTTTACCCCGTCGTATTTTTATTCACGTCACTCGGATGCATGATTAAAGAATTTGTTGCGGGAATATTAAAATTGGATGATAAAAAATTAACTTTGGCAAATGCCATACCTTTCGTATTGCCGGTATGGATGTGGTATATCAGTGGACTGTTTTTACCATGGACTCTGCTGGTTTGGCTGGCTACTACGATGATATCAAGTCTATTCTTCATGATATTCGGTCTCACTGCTGGACACCACGCTCATACAAACTTCTTCGAAGGAGACGTACCGAGAGAGGAGACACTCGATTGGGGAATCCATCAACTTGATTCAATAATAGAAAGGGTTGACTACGCGGGAGACCATTTCAAATCGCTCACTCGTTTCGGAGATCATGCCCTTCACCACCTGTTCCCAACGTTAGATCACGCCGAATTGAAGTACCTGTACCCCACATTATTAGAGCACTGTGAGAAATTTGAAACACAGCTTCGAACTACCACCTTCTACAACGCATTGATAAGCCAAAGCAAACAATTAATAAGGAAACGACCTAATAACTTCAAGCAAAAAGTGAAGCAAAGTAGTTAA

Protein sequence:

>DPOGS201044-PA
MAPDPERRQVSFPKLKYPLFREEEPKSPQKWIKAKQIQDGAEGFWRIHDNIYDLTEFIPSHPGGSQWLSMTKGTDITEAFETHHINSTAEALLPKYFIKKADTPRNSPFTFKEDGFYKTLKAKVVLKLKDIPGDVRKKSDNVTDFLFVCLVVAGPLCCWLWTKNLIYGAAATLILGLTLCALTICAHNYFHRADSWRMYLFNISGFSYLDWRISHSMSHHLYTNTANDIELSFLEPFLQYLPRPDKPLWAQMGAFFYPVVFLFTSLGCMIKEFVAGILKLDDKKLTLANAIPFVLPVWMWYISGLFLPWTLLVWLATTMISSLFFMIFGLTAGHHAHTNFFEGDVPREETLDWGIHQLDSIIERVDYAGDHFKSLTRFGDHALHHLFPTLDHAELKYLYPTLLEHCEKFETQLRTTTFYNALISQSKQLIRKRPNNFKQKVKQSS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: