MonarchBase - Protein-coding gene

DPOGS211311
Transcript	DPOGS211311-TA	1335 bp
Protein	DPOGS211311-PA	444 aa
Genomic position	DPSCF300125 - 67877-71808
RNAseq coverage	308x (Rank: top 37%)

Annotation
*Heliconius*	HMEL009363	6e-104	82.87%
*Bombyx*	BGIBMGA004964-TA	3e-168	90.00%
*Drosophila*	Ada2b-PB	7e-107	54.74%
EBI UniRef50	UniRef50_D6WTS8	3e-109	46.07%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WTS8_TRICA
NCBI RefSeq	XP_312792.4	8e-114	49.16%	AGAP003109-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|380011537	1e-112	50.00%	PREDICTED: transcriptional adapter 2B-like [Apis florea]
NCBI nr blastx	gi\|380011537	1e-121	50.51%	PREDICTED: transcriptional adapter 2B-like [Apis florea]

Group
Gene Ontology	GO:0005515	1.6e-11	protein binding
	GO:0008270	7.1e-11	zinc ion binding
	GO:0003677	3.8e-08	DNA binding
	GO:0006355	3.8e-08	regulation of transcription, DNA-dependent
KEGG pathway
InterPro domain	[63-119] IPR009057	1.6e-11	Homeodomain-like
	[9-49] IPR000433	7.1e-11	Zinc finger, ZZ-type
	[68-105] IPR014778	2.6e-08	Myb, DNA-binding
	[68-124] IPR012287	3.8e-08	Homeodomain-related
	[67-116] IPR001005	7.4e-06	SANT domain, DNA binding
Orthology group	MCL13509		Single-copy universal gene

Nucleotide sequence:

>DPOGS211311-TA
ATGTCGTTTTCAGATCTTTATGCTAAATATAATTGTACATATTGTCAAGAAGAAATCAATGGAGTACGTGTAAGATGTGCAGAATGTAAAGATTTTGATATTTGTTTGCAGTGTTTTTCTCTTGGAGCTGAAATTGGACCACACAAAAATGACCATTCCTATCAATTTATGGACTCTGGAGCTTTTGGAATATTTTTAGGTAGAACTAGTTGGTCTGCTAATGAAGAAGTAAGATTGCTAGATGCTATAGAACAGTTTGGATTTGGAAATTGGGAAGATATTGCTAAGCATATAGAAACCAAAACACCAGAAGAAGCCAAAGATGAGTATATTACTAGGTATTTGGAGGGTAGTATAGGTCGGGCTACATGGGGTAATGTGGAGAGCACTAGTCGGCCATCACTCCACTGCGCTGATAGAGATGAAGGTCCACTGAGTCCTAGTGCAGTATCAAGACTTCCACCACTAGCTATAACTGCTGATGAAGCGGCCCAGCTCGGTTATATGTCAAACAGAGATGACTTTGAAAGGGAGCATGATCATGAAGCAGAGCAATTAATATCAACATTGTCTCTTAACCCCGAGGATGACAATTTGGATGTTGCGTTGAAGTTGTCGCAAGTAGATATTTACACTCGAAGGTTGAGGGAAAGGACGAGACGGAAAAGGCTGGTACGGGATTATCAACTGGTGTCAGTATTTTTCAACAATCAGAGAAATAAACAGAAAACCCTTGGAAAACTTGCCAAAGAAAAAAAGGAGTTTACTGATCGTCTTAGATGGACGGCCCAGTTCTACGGTCGTTCGGAGCAGGCTGCCGTGGTAGCGGGTCTGTGGAGGGAACGAGAATTGAGGGTCCGCCTGGCTGAGCTTCATCGATACAGACTTGCCGGCGTTACCCGACTCGAGGAATGCGCCCACTACGAACAACACGCTGCGCATAGGAAACATCCGCATCACATCGACGTGAGACGCGTCATGGGCAGCAGTGGGTGCCTGGACGCGCAACAGACAAAAGAATCAACACAGACCAACACTCCGCAGCAGCTAAGAAAAAGAGACGTAGAAAGCGGCTCAAGTTCCACCAGCCCAAAGTGCACACGGGAAGGAAGTACCGCATGTGGATGTTGCAGAAAGAGCTCATGCAGCGCAGGATGCTCGACACATCTGCTGACCACTAATGAAATACAGTTATGTACAGCCCTCAATCTGCCTGCCACTCAGTATGTAACACTAAAGGGAGTGTTACTTCGTAAGCCAGCTCAGTCCCCTGACGCTGATGTGGATAGAGCAGTGAGGAAATATTTGTCAAATGCTGGGTGGCTTCACCATTAA

Protein sequence:

>DPOGS211311-PA
MSFSDLYAKYNCTYCQEEINGVRVRCAECKDFDICLQCFSLGAEIGPHKNDHSYQFMDSGAFGIFLGRTSWSANEEVRLLDAIEQFGFGNWEDIAKHIETKTPEEAKDEYITRYLEGSIGRATWGNVESTSRPSLHCADRDEGPLSPSAVSRLPPLAITADEAAQLGYMSNRDDFEREHDHEAEQLISTLSLNPEDDNLDVALKLSQVDIYTRRLRERTRRKRLVRDYQLVSVFFNNQRNKQKTLGKLAKEKKEFTDRLRWTAQFYGRSEQAAVVAGLWRERELRVRLAELHRYRLAGVTRLEECAHYEQHAAHRKHPHHIDVRRVMGSSGCLDAQQTKESTQTNTPQQLRKRDVESGSSSTSPKCTREGSTACGCCRKSSCSAGCSTHLLTTNEIQLCTALNLPATQYVTLKGVLLRKPAQSPDADVDRAVRKYLSNAGWLHH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: