MonarchBase - Protein-coding gene

DPOGS212431
Transcript	DPOGS212431-TA	1455 bp
Protein	DPOGS212431-PA	484 aa
Genomic position	DPSCF300258 + 103353-108415
RNAseq coverage	346x (Rank: top 34%)

Annotation
*Heliconius*	HMEL012358	0.0	74.49%
*Bombyx*	BGIBMGA002889-TA	0.0	71.81%
*Drosophila*	CG17683-PA	2e-149	54.12%
EBI UniRef50	UniRef50_Q8SYS7	3e-147	54.12%	Probable cytosolic Fe-S cluster assembly factor CG17683 n=34 Tax=Arthropoda RepID=NARF_DROME
NCBI RefSeq	XP_001605725.1	3e-169	61.48%	PREDICTED: similar to ENSANGP00000006535 [Nasonia vitripennis]
NCBI nr blastp	gi\|156545553	5e-168	61.48%	PREDICTED: probable cytosolic Fe-S cluster assembly factor AAEL012261-like [Nasonia vitripennis]
NCBI nr blastx	gi\|156545553	4e-161	61.48%	PREDICTED: probable cytosolic Fe-S cluster assembly factor AAEL012261-like [Nasonia vitripennis]

Group
KEGG pathway	afm:AFUA_4G11960	3e-55
	K00532 (E1.12.7.2)	maps->	Methane metabolism
			Glyoxylate and dicarboxylate metabolism
InterPro domain	[68-472] IPR009016	1e-113	Iron hydrogenase
	[112-414] IPR004108	1.1e-82	Iron hydrogenase, large subunit, C-terminal
Orthology group	MCL14389		Single-copy universal gene

Nucleotide sequence:

>DPOGS212431-TA
ATGGCTTCGCGGTTTAGTGGGGCGCTACAATTGACCGACCTTGATGATTTTATTACCCCATCGCAGGAATGTATAAAACCAGTGAAAATAGAGAAAAAGAAAACTCACACGGGATCCAAAATAAAAATCGGCGAAGACGGATACTTTGACCTTTCATCTGGAAAGGAACAAAAGCTTCAGAAAGTGGAGATCACTCTTGCTGATTGTCTTGCTTGTAGCGGCTGTATCACGTCAGCGGAGAGTGTACTCATTACAAAACAGAGCCAAGAAGAGTTACTTAGAGTATTCTCTGAGCGAAAATACACAGACAGCCGAGGCGTTATACAAGATGTCAGTCTCATTGTGATATCAATTTCTCCGCAACCTCTACTCTCACTAGCTGTGAGATATAAGCTAGAGCCAGAAGAAGCTACTAGAAAATTAGCCGGTTACTTCAGGAGTCTGGGCGCAGACCTGGTGCTGGACATGACAGTGGCTGAAGACCTGTCCCTGATGGAAGCCCAGCAGGAGTTTGTCCAGCGGTATAGAGATCAAGCAGACTCAGATGTTAAGACACTGCCAATGTTAGCCAGTGCTTGTCCAGGCTGGGTGTGCTACGCTGAGAAAGCGCACGGCAGCTACATCCTCCCTTACATCTCCACCACCAAATCCTCGCAACAAGTCATGGGGTCGCTGGTGAAGCAGTTCCTCGCTACCAAGAGACAGCTCGCGCCGGCTGCCCTCTACCACGTGACTCTGATGCCCTGCTATGACAAGAAGTTGGAGGCTTCCAGGGAGGACTTCTACAACGAGATATTGAACTGTCATGATGTGGACTGTGTCATAACACCCATCGAGTTGGAGCAAATGCTGACCAACCAGGACAAGGATCTGTCAGACTTCCCGGACAGTTCTCTGGACTGGTGCTGGGATGTGGCGATGACGCCGGGTGTGAGGCGCCACGGGGGCCGGGGGGCGGGGTCCTCGGGCTCCGGGGGACTCGCGGACGAGGTGTTCATGTACGCGGCCAGGGAGCTCTTCGGGGAGGAGGACGTGCCGCTCGTCTACAAGAACCTCAGGAATCCCGACTTCCGGGAAATAACTTTGGAGAAGGATGGCCGGGAGGTCCTGAGGTTCGCCATCGCCAACGGCTTCCGGAACATACAGAACCTGGTGCAGAAACTGAAGAGGGGCAAGTCTCCCTACCACTACGTGGAGGTCATGGCCTGCCCTTCAGGTTGTCTGAACGGCGGCGCCCAGGTGCGACCAACCGAGGGTGAGAGCGGTCGCGCGCTGGTGGGGAGGCTGCAGGAGCTGATGGAGACTCTCCCGCCCGCGGAGCCCTCCGGGACCGCGGTTAGACACCTCTGGAGCGCCTGGCTCGGGGCTGCGGGCCCGGAGCGAGCGAGACACGCGCTACACACCACCTACCACGCTGTGCAGAGTAACGACATCGCACTCACCACCAAGTGGTGA

Protein sequence:

>DPOGS212431-PA
MASRFSGALQLTDLDDFITPSQECIKPVKIEKKKTHTGSKIKIGEDGYFDLSSGKEQKLQKVEITLADCLACSGCITSAESVLITKQSQEELLRVFSERKYTDSRGVIQDVSLIVISISPQPLLSLAVRYKLEPEEATRKLAGYFRSLGADLVLDMTVAEDLSLMEAQQEFVQRYRDQADSDVKTLPMLASACPGWVCYAEKAHGSYILPYISTTKSSQQVMGSLVKQFLATKRQLAPAALYHVTLMPCYDKKLEASREDFYNEILNCHDVDCVITPIELEQMLTNQDKDLSDFPDSSLDWCWDVAMTPGVRRHGGRGAGSSGSGGLADEVFMYAARELFGEEDVPLVYKNLRNPDFREITLEKDGREVLRFAIANGFRNIQNLVQKLKRGKSPYHYVEVMACPSGCLNGGAQVRPTEGESGRALVGRLQELMETLPPAEPSGTAVRHLWSAWLGAAGPERARHALHTTYHAVQSNDIALTTKW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: