MonarchBase - Protein-coding gene

DPOGS210450
Transcript	DPOGS210450-TA	1122 bp
Protein	DPOGS210450-PA	373 aa
Genomic position	DPSCF300062 + 111581-119237
RNAseq coverage	1x (Rank: top 94%)

Annotation
*Heliconius*	HMEL004041	2e-28	47.20%
*Bombyx*	BGIBMGA011436-TA	1e-06	26.50%
*Drosophila*	CG5783-PA	3e-20	27.45%
EBI UniRef50	UniRef50_B0XIX8	3e-18	28.70%	Putative uncharacterized protein n=2 Tax=Culex quinquefasciatus RepID=B0XIX8_CULQU
NCBI RefSeq	XP_002065604.1	1e-20	28.92%	GK15541 [Drosophila willistoni]
NCBI nr blastp	gi\|195435229	3e-19	28.92%	GK15541 [Drosophila willistoni]
NCBI nr blastx	gi\|195435229	2e-19	28.92%	GK15541 [Drosophila willistoni]

Group
Gene Ontology	GO:0016747	1.5e-17	transferase activity, transferring acyl groups other than amino-acyl groups
KEGG pathway
InterPro domain	[236-360] IPR016181	1.1e-32	Acyl-CoA N-acyltransferase
	[286-367] IPR013653	1.5e-17	FR47-like
Orthology group	MCL17250		Insect specific

Nucleotide sequence:

>DPOGS210450-TA
ATGGTGCATCGCTTAAAACTAGTGCCTATTCAAAAATGGCCTGAAATAAGATCTTTATTAAAATTATATCTTCCCAGAAGTATAGCTGGGCAAAATTTTTTGAAGACCAGGGAAGAAATTGAAAAGATTGGTTATGGGTATAAAGCCGAAGTGTACTGCCCAGACGGTGATGCCTCTAATGGAATTGTTGCCCTTAACGTTAAGGACAAGCTCTGCGAGGTTAATATTCAGTGCCCTAAATATGATACCGGAAAACTGGAAGAAGCTTTGAGAACAACAGAAGTAATAGACTGGACCAAATGTGTAAAATTGATATACGCTCAAAAGCATGTGATGCAATGTATGATGAAAGCAATAAGGGATAAAAATATTGCCATAAAAGAAGTCATACCTTCAGTGACATTTGTCAAGTATAACAACGATCCACTTTTTGACGTAAGTTTACCAAAAGGATATAGTTTTGAGGCGTTAACTCTAAAGTATGTAGATATGAATTCCTTTTACGAAGTGATTATCCAATGCCCGAATAATGACACCACAGAACTTGAAGAAGCTTTGAAAACAACAAAAGTTATAGACTGGGCGCGAAAACTTGAAGTTCCGTTCGCACCTAAAAATGTACGAGACTGTATGGAAAGAATCATAAATGAAAGAAATTACACATTACAGTACATTGATATTACAGACACGTTTATACTCAAGAGAAACGCAACACCATTCAATATGAGACTAGCCCCGGAACTGTCCTTCAAACTTCTTACTTTACATTACAAGGATACGGTTAATAACGCATGGCCGCACAAATACCCGGGATCTGATTGGTATTTTGAATTACTAATAAAAGCCAATTTAGGCTACGGCCTGTTTAAAGGAGACGAGCTAATTTCGTGGGTTTTCATTAAAGAAATGGGAGCGCTCGGACATCTCTACACTTTGGAGGAGCATAGAAGGAAAGGTTACGGAGAATTAGTTTTAAAACTCATATCAAATGTATTACTGAATGAGGGGAAATACGTCGTAGCTTTTTGCATCAAAGGTAATGAGAATGCATGCAAGCTGTATAAAAAACTGAATTTCGAGAACGTCCAAGTCGTTTATTGGTGCAATTTTATAGGTAATTAA

Protein sequence:

>DPOGS210450-PA
MVHRLKLVPIQKWPEIRSLLKLYLPRSIAGQNFLKTREEIEKIGYGYKAEVYCPDGDASNGIVALNVKDKLCEVNIQCPKYDTGKLEEALRTTEVIDWTKCVKLIYAQKHVMQCMMKAIRDKNIAIKEVIPSVTFVKYNNDPLFDVSLPKGYSFEALTLKYVDMNSFYEVIIQCPNNDTTELEEALKTTKVIDWARKLEVPFAPKNVRDCMERIINERNYTLQYIDITDTFILKRNATPFNMRLAPELSFKLLTLHYKDTVNNAWPHKYPGSDWYFELLIKANLGYGLFKGDELISWVFIKEMGALGHLYTLEEHRRKGYGELVLKLISNVLLNEGKYVVAFCIKGNENACKLYKKLNFENVQVVYWCNFIGN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: