MonarchBase - Protein-coding gene

DPOGS215980
Transcript	DPOGS215980-TA	1542 bp
Protein	DPOGS215980-PA	513 aa
Genomic position	DPSCF300078 - 444551-446423
RNAseq coverage	201x (Rank: top 47%)

Annotation
*Heliconius*	HMEL008679	0.0	93.76%
*Bombyx*	BGIBMGA001210-TA	0.0	87.98%
*Drosophila*	rib-PA	3e-45	65.55%
EBI UniRef50	UniRef50_UPI0002061A0D	6e-69	34.99%	UPI0002061A0D related cluster n=1 Tax=unknown RepID=UPI0002061A0D
NCBI RefSeq	XP_974222.2	4e-81	38.28%	PREDICTED: similar to ribbon [Tribolium castaneum]
NCBI nr blastp	gi\|270005150	3e-81	38.62%	hypothetical protein TcasGA2_TC007162 [Tribolium castaneum]
NCBI nr blastx	gi\|158300789	2e-115	46.82%	AGAP011902-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005515	2.7e-20	protein binding
	GO:0003677	4.5e-11	DNA binding
KEGG pathway
InterPro domain	[25-142] IPR011333	2.3e-27	BTB/POZ fold
	[53-149] IPR000210	2.7e-20	BTB/POZ-like
	[47-142] IPR013069	1.4e-19	BTB/POZ
	[337-398] IPR009057	9.2e-14	Homeodomain-like
	[345-388] IPR007889	4.5e-11	Helix-turn-helix, Psq
Orthology group	MCL15310		Insect specific

Nucleotide sequence:

>DPOGS215980-TA
ATGTTTCCTGTGTCAACTTACGAAGGCGTCCTGCCAGAATCGCAATTCAAAAAGATGGGGAGCAGTGAAGGCCAGCAAACTTTTTGTTTGAAATGGAATCACCATAAAACAAATCTGGTAGAAATATTGGAAGCTTTAATAAAAGTTGAAACATACGTCGACTGCACTTTAGTCGTCGATGATCAAGTTACGTTTAAAGCACACAGAGTTGTGCTCGCCGCTAACTCTCCATATTTTCAATCGATCCTAGCTGATGTGCCTATGGATCATTGTAGCATACTTTTCCCCGGAGTCAAGGATTTTGAAATGAGAGCCCTTCTCGAATACATGTACACGGGTGAAGTCAATGTCACACAAGCGCATATACCACGAATCATGAAAGTGGCTGAACAACTTGAAGTCAAAGGTTTGTTTGATATGACGGAGCTGAGACGCCGCCCTGGAAGCAGCGAACGTACCCCCGCTGCCTCCCCACCACGAGTAGTACCGGCTGCTCCCTCTAGTGTTTCTCCTCCTGCACCAAATAATCGCTGGCCACCACCGCCTACAGCTCCAGTACTTTCGGCTGCCTACGACTCTGCTGATATGAATCCATTAAAACGCAAAAAGTTATCAAGTATGCTAGCCACTCGTGATACCCCAATTTTAAGAAATGTTCTAGCACAGACAACTCCTGTAGATTCCTCCCAACCTATGTCTCTTGTCTGCCATCCTGTTAGTCAGCTTGAGTCAACACGTTTGCATTCAAACGGATCAGCTCATGAATTAGATCGGTCTGTAAGCCCCCAAAGACCTTTCGACTACAGGCCTCGTCGGTTGTCGTCTAGGGCGTCATCTCCTCATTATAATCGCTCAGATCGTTCAGAAGATGCTCATTCACCATACACAGAGCGATCTTTTGAGGAAGATAATCAACGTACTTTCCACCCTTCTCCCCCACCAGCTAATTTCCAACAAGACGTGCGAGCTGGGCTAGCGCCATATGTACCACCGCAACAAAAACCGGAATGGAAACGATATAAGCAATACACGCGATCAGACATTATGTCTGCTATAGAATGTGTGAGGAATGGCATGAGCGCTTTACAGGCATCGCGTAAATATGGCGTGCCCTCACGTACTCTATACGACAAGGTAAAAAAACTTGGTATTACAACAAGTCGTCCCATGAGCCGCGGAGTTAAAAGGGAATCGAATGGAGCTGCTTTCCCTTACGGTTTAAGCGGCACTGGTGGTAATGATGATGTAACACCTACTACTCCGCTCATCGACCCGTCCTTCCTACAACAAGCATTAGAAGGCGCTACAAGAGACGGGGGGCGCGAAGCTTTACACGCTATGGCCTTAGCTGCAGCAGCACATGCAGCATTGACTCCTCGAACCCCACCACGCTCAGCGCCACAATCACCAAGAACTCCACCACCTGACGATGACCATGTCGAGGACTTGTCAGTCGCGCGCAGACGCGATCCAGACCCTCCATCCGGCGTCATTGTCCCGCCACGTAATTTTGCTCTAGATTGCAATAGCGAAAGGGATTAA

Protein sequence:

>DPOGS215980-PA
MFPVSTYEGVLPESQFKKMGSSEGQQTFCLKWNHHKTNLVEILEALIKVETYVDCTLVVDDQVTFKAHRVVLAANSPYFQSILADVPMDHCSILFPGVKDFEMRALLEYMYTGEVNVTQAHIPRIMKVAEQLEVKGLFDMTELRRRPGSSERTPAASPPRVVPAAPSSVSPPAPNNRWPPPPTAPVLSAAYDSADMNPLKRKKLSSMLATRDTPILRNVLAQTTPVDSSQPMSLVCHPVSQLESTRLHSNGSAHELDRSVSPQRPFDYRPRRLSSRASSPHYNRSDRSEDAHSPYTERSFEEDNQRTFHPSPPPANFQQDVRAGLAPYVPPQQKPEWKRYKQYTRSDIMSAIECVRNGMSALQASRKYGVPSRTLYDKVKKLGITTSRPMSRGVKRESNGAAFPYGLSGTGGNDDVTPTTPLIDPSFLQQALEGATRDGGREALHAMALAAAAHAALTPRTPPRSAPQSPRTPPPDDDHVEDLSVARRRDPDPPSGVIVPPRNFALDCNSERD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: