MonarchBase - Protein-coding gene

DPOGS200190
Transcript	DPOGS200190-TA	2469 bp
Protein	DPOGS200190-PA	822 aa
Genomic position	DPSCF300360 + 44533-80358
RNAseq coverage	1681x (Rank: top 8%)

Annotation
*Heliconius*	HMEL009892	7e-142	78.51%
*Bombyx*	BGIBMGA005097-TA	3e-128	77.32%
*Drosophila*	sima-PA	2e-87	41.37%
EBI UniRef50	UniRef50_D6WMG7	1e-132	47.08%	Hypoxia inducible factor 1, alpha subunit n=3 Tax=Pancrustacea RepID=D6WMG7_TRICA
NCBI RefSeq	XP_967427.2	1e-133	47.08%	PREDICTED: similar to hypoxia-inducible factor 1 alpha [Tribolium castaneum]
NCBI nr blastp	gi\|189237669	2e-132	47.08%	PREDICTED: similar to hypoxia-inducible factor 1 alpha [Tribolium castaneum]
NCBI nr blastx	gi\|189237669	5e-128	42.24%	PREDICTED: similar to hypoxia-inducible factor 1 alpha [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	5.3e-14	protein binding
	GO:0007165	1.1e-10	signal transduction
	GO:0004871	1.1e-10	signal transducer activity
	GO:0006355	8.6e-10	regulation of transcription, DNA-dependent
	GO:0005634	6.4e-05	nucleus
	GO:0003700	6.4e-05	sequence-specific DNA binding transcription factor activity
KEGG pathway	tca:655772	3e-133
	K08268 (HIF1A)	maps->	Pathways in cancer
			mTOR signaling pathway
			Renal cell carcinoma
InterPro domain	[219-303] IPR013655	5.3e-14	PAS fold-3
	[62-128] IPR000014	1.1e-10	PAS
	[69-128] IPR013767	8.6e-10	PAS fold
Orthology group	MCL10512		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200190-TA
ATGCAAATCTTCGCGGAGCTGACAGCATCACTACCAGCTAAGAAGGAAGACGTCGAACAGTTGGACAAAGCTTCCATAATGAGACTCGCCATATCATATCTACGTGTGCGTGATGTTGTGTCTATGTTGCCAGAAGATAAGGAGGTTCCGTTAATGCAGAGTCCCAAAGGCCTGGAGGAGATCCAATCAGAGCTTTCATATATGAAAGCGTTGGATGGATTTGTTCTGGTCCTATCCCAACAGGGCGACATCGTCTACTGCAGCGAGAATGTTGCTGAGCATCTTGGAGTTTCACAGATGGAGGTCATGGGTCAGAGTGTGTTCGAGTTCAGTCACCCCTGCGACCACGAGGAGGTGAGGGAGGCTCTGAGGTCAAGTAAAGATGGCAAGAGAGACCTATTGTTGCGTCTCAAGTGCACTCTCACCAGTAAAGGGAGGAACGTTCATCTCAAATCTGCTTCTTATAAGGTGATCCACGTAACTGGACACATGCTGACAGAAGAAAATCAAACTGATGGAGATAAAGATACAAAGAAAATCGGCAAATCCGCGCTCGTAGCTGTGGGAAGACCGATACCTCATCCATCCAACATAGAAACTCCTTTGAACAATATGACTTTCCTCACAAAGCACAGCTTGGACATGAAATTCACTTATAGTGATGAAGGTCTTCAAAATGCCCTTGGATATGATTCCAATGATCTGGTCGGTCATACCCTGTATGACTACCATCATGCAGGCGACAGCGCTGTACTGCTGCAGCAATTTAAATCATTGTTCTCTAAGGGACAATGCGAGACCGGACAATACCGATTCCTCGCCAAGAAGGGCGGCTACGCCTGGGTCCAAACCCAGGCCACCGTCATCACAGACAAGCAACAAAAGCCGATTAGCGTCATCTGCGTCAACTACGTCATCAGCACAGGTGATGTAATTCAAGATTGTCGGACGTTGCCTCGGTCACGTACAGACTCGGAGCAAGTTGAAAACGAGGGTGCTGTGAGCGGTATCGAGTGCAAAGATGAGGTGTTCGCTGCACACCAAGTGCAGCACGCAGACTTGAAGCCTGCCGTGGCTCCGACTATACCAGAAGCTAATCCAGCACAGATTTGTGTGGCCACTGAACCATCTAACGGTGCTATAGTGGCCGCTGTCCTTCCAGAAGAAGAGCGCCCTGTACCCGTTACTGAACTTATATTTGCACCCAGAAAGAAGGAAATGAATAAAGGATTTCTCATGTTCTCTCCTGACGAGGGACTTACAATGCTTAAAGACGAGCCGGAGGACCTCACACATTTGGCGCCGACGGCTGGAGATGCTTGCATTCCTTTAGAGAACAGCCCTTTTGACATGTTTGACGAATTCATTTTAAGTGACAATTATTGCAGTCTACTTGGTGATGATCTGACTAGTGGATCACCAGTAGATTCGTTGATAGCGGATTCCTTACTCTCGTCCCCAGAGCCACAGGAAACCGAATCATCGTGCGAACAGTCGTCGCTTCTGAACGAGTTGTCTTTGGATGCGTTTGATAGTAACAAGTCTGAGAATGACATCGACGATGGACATTCACCATTCATTCCCACTACTGACGAGCTTCCCCTTCTGGAGCCAGCAGTTATGTGGGGGGCTCTGCCTGACAACGTGTGCCAGGCTAGACCTCAACCGACCGAAGTTCAAAGCCCCGCACCAGCGTTGCAGCGCTTACTAGCAGCGCCACCGACCGGGCCACGACCGCAAGATCTCATCACAAATATATATTCAGATCAAGGTCTTATTCCAAGCAAGATATCAACATGGGACACTGGTGTTAAGCGTGTTTTGACCAAAGACGAAGAGCCTTCAGCGAAACGCGTGAAGCGTAGTCCGTCACCGACAACGAATCAGACCTCAAGCGTCCTTATGAACCTCCTGGATGTCCATAATAATGGAAAGACGACGAATCAGCTGCCAAAATATCAGATGCTAGTCACTCCACCGACAGCCTCGCCTCAAAGCCCAATCCGAAACATCCCGGTGCCGGTCATAAACATGATGCAGCCCAATCAGCAACTCCGAAACACGATAACCAATCAAATAAGCACAAACATATCAAATCCAATGTCCCCACTGACTTTAAACGTCGGAAGTCCATTATACTCCCTGCCATCAAGTCCAGCTATAAGTCCAATCCAAAGAGATCGCGTTCTGAGCCCCTACTCCACTCCCCAATCTTTATCACCCGCCGGTAGTTATCAAATGTACAGCCCGAATAGCAACATTCTCCTATCACCCTCCGGAGTAATGCAAGGTTATGATCCGTATTTGACGAATAAAATGCAAACTAGCCCCGGATATCCTCTCCAGACGTCAGATATGCTGATGGATTCCAACATCCAGCTGCAATCTGCCGACTTCTGGTCTGATTCTGAGATGCTGCAAGGCACGAGCGATCTCCTCACAGCATTCGACGACGTCAAATTGGTGTAA

Protein sequence:

>DPOGS200190-PA
MQIFAELTASLPAKKEDVEQLDKASIMRLAISYLRVRDVVSMLPEDKEVPLMQSPKGLEEIQSELSYMKALDGFVLVLSQQGDIVYCSENVAEHLGVSQMEVMGQSVFEFSHPCDHEEVREALRSSKDGKRDLLLRLKCTLTSKGRNVHLKSASYKVIHVTGHMLTEENQTDGDKDTKKIGKSALVAVGRPIPHPSNIETPLNNMTFLTKHSLDMKFTYSDEGLQNALGYDSNDLVGHTLYDYHHAGDSAVLLQQFKSLFSKGQCETGQYRFLAKKGGYAWVQTQATVITDKQQKPISVICVNYVISTGDVIQDCRTLPRSRTDSEQVENEGAVSGIECKDEVFAAHQVQHADLKPAVAPTIPEANPAQICVATEPSNGAIVAAVLPEEERPVPVTELIFAPRKKEMNKGFLMFSPDEGLTMLKDEPEDLTHLAPTAGDACIPLENSPFDMFDEFILSDNYCSLLGDDLTSGSPVDSLIADSLLSSPEPQETESSCEQSSLLNELSLDAFDSNKSENDIDDGHSPFIPTTDELPLLEPAVMWGALPDNVCQARPQPTEVQSPAPALQRLLAAPPTGPRPQDLITNIYSDQGLIPSKISTWDTGVKRVLTKDEEPSAKRVKRSPSPTTNQTSSVLMNLLDVHNNGKTTNQLPKYQMLVTPPTASPQSPIRNIPVPVINMMQPNQQLRNTITNQISTNISNPMSPLTLNVGSPLYSLPSSPAISPIQRDRVLSPYSTPQSLSPAGSYQMYSPNSNILLSPSGVMQGYDPYLTNKMQTSPGYPLQTSDMLMDSNIQLQSADFWSDSEMLQGTSDLLTAFDDVKLV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: