MonarchBase - Protein-coding gene

DPOGS204961
Transcript	DPOGS204961-TA	1878 bp
Protein	DPOGS204961-PA	625 aa
Genomic position	DPSCF300160 + 571957-576942
RNAseq coverage	468x (Rank: top 26%)

Annotation
*Heliconius*	HMEL003737	0.0	67.18%
*Bombyx*	BGIBMGA011130-TA	0.0	60.57%
*Drosophila*	CG7706-PA	7e-111	47.81%
EBI UniRef50	UniRef50_UPI00022479C3	1e-124	46.53%	UPI00022479C3 related cluster n=3 Tax=unknown RepID=UPI00022479C3
NCBI RefSeq	XP_972658.1	4e-135	49.35%	PREDICTED: similar to smad nuclear interacting protein [Tribolium castaneum]
NCBI nr blastp	gi\|91091446	8e-134	49.35%	PREDICTED: similar to smad nuclear interacting protein [Tribolium castaneum]
NCBI nr blastx	gi\|91091446	9e-140	46.86%	PREDICTED: similar to smad nuclear interacting protein [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	2.2e-29	protein binding
KEGG pathway
InterPro domain	[89-199] IPR000253	2.2e-29	Forkhead-associated (FHA) domain
	[50-195] IPR008984	6.5e-28	SMAD/FHA domain
Orthology group	MCL12931		Single-copy universal gene

Nucleotide sequence:

>DPOGS204961-TA
ATGTCTGACAACATAGAAAACCCCGACGTGCCGAGCTCACCCAAAATTGAATTTAAAAAGCCAATACTTTTCGGAAAGATCGGTAAACTACCAAAAAAGTCGAAAGCGGAACCTAGTGCAACAGAGGAAAAGAAAGATGAGGAAAAAAATGAAAATACGACTGAAGGTCACTCTAAAAGTTCTTTACCGCCAGCAGTTTTGCTAAAAGAATTATCAATTCCTATACCATACAAGGAGCCAAAATGGTCTGGATTTTGTCCGGAAGGATCGGACTATGCTTTGGAGGTACTGAAATCGGGTATGATCATGGAAAAAATCGATCTTACGAAAAAAGCCTTCTATGTATTTGGACGTCTTGCAAATTGTGATGTTGTTATGGCACACCCGACAATATCCAGACATCACGCTGTTCTCCAATACAAGGCCTTCGCTAATGACGACGAGCCAGCATCCGGGTGGTATTTATTCGACCTGGGAAGCACCCACGGCACGTTCCTGAACAGGGATAGAATAAAGGAGCAACATTACACGAGGGTCAGGGTGGGACATCAGATTAAATTTGGTTCTAGCACAAGAACTTACATTGTATTGGGTCCAGACTTTGATGCTGACGGTGAATCAGAACTGACAGTCACCGAAATAAGACAAAGGGCGCTCAACATGAAGCTGGAGAGAGACAGAATGATAAGAGAAGCCATAGAGCAGAGGGAGAGGGATAGAGTGGAGGAAGAAAGGAGGAGGGAGGAACAGGGAATTGACTGGGGGATGGGCGAGGACGCTGATGATGAACCGGATCTGTCAGAGAACCCATACGCCTGTACAGCAAACGAGGAGTTGTTCCTGGATGATCCAAAGAAGACACTAAGAGGTTACTTCGAGAGGGAGGGTTTAGAACTGGTGTACGACTGTGATGAACGAGGAATTGGCCAGTTTCTGTGCAGAGTGGAGCTCCCGCTAGACGACGCCAGAGGCAGGCCGCTTGTAGCGGAAGTGCTTCACAAAGGAAAGAAAAAAGAGGCTGTGGTGGCTTGCGCTCTAGAAGCCTGCAGGATACTGGACCGAGCTGGGTTGCTACGACAAGCCAAACATGAGTCCCGCCGTAAGAAACAGCGTGACTGGTCGGCGGACGACTACTACGACTCCGACGATGACACCTTCTTGGACAGGACCGGGAGTGTGGAGAAGAAGAGACAGGCCAGGATGGAGAAGAACGGACTGAAGGACACTGAGAAACCACTCACATACGAGGATCTGCTCAAACAGATAACGGACATTGAGAACAAAATAGCATCAGAAGAGAAGATTCTAGAAGCTCTGCGAGTGAAGAGCAAGCAGAGTGAGCTGGTCGACCACGAAGAGGATGCCTTGGACGAGTTCATGAATACTCTGCACACGGGACACAGCATGGCTCATAAGGCTGAGATATCCAAAGCCAAGATGAGCATACAGAAGCTAAAAACCGATCTGTCAAAAACCCGTCGCCTGTGCGAACTGGCTCGCCCCGCGGACGCTCCTCCCCTCCTCAAGAAGGACAGCACACCCGCCATTAAACAGACACACGCAGTCACATACGGCAAGAGGATACGGTTAAAAGACGACAAACCGAAGCCAAAGATCATCAAACAGAGCAAGCGAGAAGAGGAGTTCGTTGAGGAAATGGACTCCGACGAAGATAGTGAATCAAAACCCACACCCATCGTGGAAACTGAAAGCAAATCTGATAGTCCAGTCAGAAGAGACAGCGATGGCACCGTGGCTGTGGAGACGAAGAAATTGTATGGTCCGATGAGGCCGCCGGAGAATTATGTTGTACCCGAAAATTATTACGACGAAGCAACTGACAGGGACCTGCCGGAAATAGAAGAAGGAGTTGAATAA

Protein sequence:

>DPOGS204961-PA
MSDNIENPDVPSSPKIEFKKPILFGKIGKLPKKSKAEPSATEEKKDEEKNENTTEGHSKSSLPPAVLLKELSIPIPYKEPKWSGFCPEGSDYALEVLKSGMIMEKIDLTKKAFYVFGRLANCDVVMAHPTISRHHAVLQYKAFANDDEPASGWYLFDLGSTHGTFLNRDRIKEQHYTRVRVGHQIKFGSSTRTYIVLGPDFDADGESELTVTEIRQRALNMKLERDRMIREAIEQRERDRVEEERRREEQGIDWGMGEDADDEPDLSENPYACTANEELFLDDPKKTLRGYFEREGLELVYDCDERGIGQFLCRVELPLDDARGRPLVAEVLHKGKKKEAVVACALEACRILDRAGLLRQAKHESRRKKQRDWSADDYYDSDDDTFLDRTGSVEKKRQARMEKNGLKDTEKPLTYEDLLKQITDIENKIASEEKILEALRVKSKQSELVDHEEDALDEFMNTLHTGHSMAHKAEISKAKMSIQKLKTDLSKTRRLCELARPADAPPLLKKDSTPAIKQTHAVTYGKRIRLKDDKPKPKIIKQSKREEEFVEEMDSDEDSESKPTPIVETESKSDSPVRRDSDGTVAVETKKLYGPMRPPENYVVPENYYDEATDRDLPEIEEGVE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: