MonarchBase - Protein-coding gene

DPOGS210522
Transcript	DPOGS210522-TA	1797 bp
Protein	DPOGS210522-PA	598 aa
Genomic position	DPSCF300186 + 248132-253319
RNAseq coverage	477x (Rank: top 26%)

Annotation
*Heliconius*	HMEL016340	0.0	76.22%
*Bombyx*	BGIBMGA012625-TA	0.0	60.51%
*Drosophila*	CG5645-PA	4e-97	45.10%
EBI UniRef50	UniRef50_D6WTE2	2e-116	47.13%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WTE2_TRICA
NCBI RefSeq	XP_973472.2	1e-116	47.13%	PREDICTED: similar to CG5645 CG5645-PA, partial [Tribolium castaneum]
NCBI nr blastp	gi\|350419810	3e-116	44.44%	PREDICTED: protein KRI1 homolog [Bombus impatiens]
NCBI nr blastx	gi\|270010258	2e-150	44.79%	hypothetical protein TcasGA2_TC009637 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[3-577] IPR018034	3.2e-147	KRR1 interacting protein 1
	[272-365] IPR007851	1.1e-24	KRR1 interacting protein 1, subgroup
Orthology group	MCL12978		Single-copy universal gene

Nucleotide sequence:

>DPOGS210522-TA
ATGACTAAAAAAAAGAAGCTTTTTGATGAGGAATCTGATGAGGAAGTTACCTTAAAAACAGAAAACGAATACGCCAAAAAGTACGACACCTGGCGAGAAAAAGAAGAATTGTATAAACTGGAACAAAAATATGGTTCCAAAGCACTTAACTCGGATGCGTCTGTCTCTTCTGACAGTGAAGACGAAAGTGACGAGGCTCCAGAAATATCGGAGGAAGTGGAGAAGCAGTTCCTGAAGACCCTATCACTGTTGAAAACCAAGGACCCTAGAATCTATGACCCCAATTACAAATTCTTTGATGAGAGAGTGGAGAAGGAAAAAGAAAAGGAACCAGAGACTAAAAAGTTAACTTTTGGTGAAAGTGATGATGACGAAGATGATGGAAATATCTTTAGCATTGAGAAGAAGGCGGATATAGAGGACCCAGGGGGTGGTGCTCAGGAGCTGAAGGATCAAAAGAGTGACCTCAAGGCATTCCTGACGGGGAGTGTAGAGCATGTGGAGGATGAGGCTGAGCTGGCTCCGTTGCGTGCTCTGTGGAGCGACCCAAACCTCAACGAGGGAGAGGCCTTCCTGAGAGACTACATACTGAATAAAAGATATCTCGAGGACGGTCCAGCAGCAGCGAGCCAGCTCCGAGACGACGAGGAGCTGGAGGAAGACGAGAAGAGAGTCGAGGAACAGGGGCAGTTCGAGAGAGCCTACAACTTCCGCTTCGAGGAACCCGACCAGGAGTTTTTGAAACGCTTTCCCCGCACAATGAACCACATCCGGCCCAAAGATACGAGCAGAGCCAAAAAACGAGCCGAAGTGAAAGAGAGGAAAGAGAAGGAGAAACAGAGGAAGATGGAAGAGATCACGAGGATGAAGGCGCTCAAGTTGAAGGAAATCAAGGAAAAGATCGCTAGGATCAAGGAAGTCACCGGCAACGAGGAGCTGGCGTTCAGGGAGGAGGACATAGAAGGCGACTTCGACCCCGAGGAACATGACAGAAGAATGAAGGCTCTGTTTGATGACGAGTACTACGGAGATGTGGACGAACAGAAACCAGTGTTCCCTGACCTGGACGAGGAGCTGGAGATCGAGAACTGGGATAAATACGAGCATGAAGAGAACGCTCCTGACGAGAATGAGCATGACGGACCACACTGCGAGGACGAGGACTTTAATATGGACGCAGACTACGACCCGAAGAAGGCGAGGGAGAGTTTACTGGAGGAACTGACGAGCAACATGGCCAAGAAGAAACGGAACAGGAAGAAGAAGTCCAAGCTGGCCGAGCTGCTCTCGGAACAGAAACCTAAGTTCGTACCGGAGGTGGACAAGACATACTCCCAGTACATGGAGGAGTATTACAAGATGGACTGCGAAGACATCATCGGAGGGGACCTGCCCACCAGGTTCAAGTACAGGCAGGTCGTCCCCAATAACTACGGCCTGACTGTGGAGGAGATCCTTCTGGCGGACGACAAAGAGTTGACCCAATGGGTCCCTCTCAAGAAGATCGTCAAGTACAGACCAGAGAATGTTGAGAAGAGTGAAGTTCACTCATACACACAGAAAGCGGCCGACGAGAGGCTCAAGAAGAAGATACTGCCAAGTCTGTTCCGAGGAGTGCCGGATGAACCAGAAATAGTTGTCCCATTAGAGAAGACTATCAAAAAGAAGAAAAAGAAGAAGAAGAAACAAGAAGATGTAGAAAATAATGAAATTGATAATGAGGGGTCTAATGATATTGATAATAATGGAAATAATGATAGCGTGGAAGATAGTGATGACGAAGAAGAAAAGGAATAA

Protein sequence:

>DPOGS210522-PA
MTKKKKLFDEESDEEVTLKTENEYAKKYDTWREKEELYKLEQKYGSKALNSDASVSSDSEDESDEAPEISEEVEKQFLKTLSLLKTKDPRIYDPNYKFFDERVEKEKEKEPETKKLTFGESDDDEDDGNIFSIEKKADIEDPGGGAQELKDQKSDLKAFLTGSVEHVEDEAELAPLRALWSDPNLNEGEAFLRDYILNKRYLEDGPAAASQLRDDEELEEDEKRVEEQGQFERAYNFRFEEPDQEFLKRFPRTMNHIRPKDTSRAKKRAEVKERKEKEKQRKMEEITRMKALKLKEIKEKIARIKEVTGNEELAFREEDIEGDFDPEEHDRRMKALFDDEYYGDVDEQKPVFPDLDEELEIENWDKYEHEENAPDENEHDGPHCEDEDFNMDADYDPKKARESLLEELTSNMAKKKRNRKKKSKLAELLSEQKPKFVPEVDKTYSQYMEEYYKMDCEDIIGGDLPTRFKYRQVVPNNYGLTVEEILLADDKELTQWVPLKKIVKYRPENVEKSEVHSYTQKAADERLKKKILPSLFRGVPDEPEIVVPLEKTIKKKKKKKKKQEDVENNEIDNEGSNDIDNNGNNDSVEDSDDEEEKE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: