MonarchBase - Protein-coding gene

DPOGS212132
Transcript	DPOGS212132-TA	3318 bp
Protein	DPOGS212132-PA	1105 aa
Genomic position	DPSCF300038 + 18623-30842
RNAseq coverage	459x (Rank: top 27%)

Annotation
*Heliconius*	HMEL003820	0.0	71.51%
*Bombyx*	BGIBMGA006582-TA	0.0	69.63%
*Drosophila*	IA-2-PC	2e-165	50.29%
EBI UniRef50	UniRef50_D6WZ66	0.0	45.93%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WZ66_TRICA
NCBI RefSeq	XP_974566.2	0.0	45.83%	PREDICTED: similar to receptor-type tyrosine-protein phosphatase N2 [Tribolium castaneum]
NCBI nr blastp	gi\|270013937	0.0	45.93%	hypothetical protein TcasGA2_TC012616 [Tribolium castaneum]
NCBI nr blastx	gi\|270013937	0.0	46.53%	hypothetical protein TcasGA2_TC012616 [Tribolium castaneum]

Group
Gene Ontology	GO:0006470	6.9e-107	protein dephosphorylation
	GO:0004725	6.9e-107	protein tyrosine phosphatase activity
KEGG pathway	dme:Dmel_CG31795	2e-163
	K07817 (PTPRN)	maps->	Type I diabetes mellitus
InterPro domain	[804-1067] IPR000242	6.9e-107	Protein-tyrosine phosphatase, receptor/non-receptor type
	[962-1064] IPR003595	1.2e-36	Protein-tyrosine phosphatase, catalytic
	[578-652] IPR021613	5.6e-07	Protein-tyrosine phosphatase receptor IA-2
Orthology group	MCL12075		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS212132-TA
ATGGCCCAGGGCGACAAATTCGGGGGGGCGCCAAGGTCTGAAGTTGGAGTCTCTCAAGAAGTAGTAGTACAAAGAAGTACCGCGGGGAAGTGGCATCGTGTGAATGGAGGAGCGCATGATCGATACAGCGGAGTGCGCAGGTCCCACCAACTAAGTACAGCTGTAGTCTTTGCATCTTATCGTGCAAGTCGTTCTAAACGGCGTCACGCTCTCGGAAGAATTAATTATCACGGATATGTTCCGGCTTTTTTGGCGGATCTAAACGATGTAATGAGCCGTACGTGCTATCGGCAGGCTCTGTGGGCGCTGGCGGTGATATGTACGCTGGCGCCCTCGAATGCCGACGGGAATATTGGTTGTTTGTTTAGCTCGTCCTTATGCATTGACGGAGCTGAGTGGTGCTATGATGATTTCGCATTTGGAAAATGCATTCCGATCTATGACAACGATCCCGAAGAGGGGTCACTTTACCAATATGATATGAGCTCTACGCAGCTACAGTGGTTCGAGAGGGAGTTGCAACAACTAGCAGCCCAAGGCTATCGCTGGGAGCACGCATTCACGCAATGCATGCTGCAAAGTATGTTGTACGCTCTACGACATCACCTGGATCCAAATCAAGTTAACTCAAAGCTGTGTGAGCATTTCGCGGATCCCAAGCTAAGTGCGGGAGTAACAAACGTTGGAGACGAAACGTTGGATGCTAACTCTGATGAAACAGCGTACATAAGATTCGTACCAAACACTAAATTGATCGACTCAGATTATGCAAATGAAGTATATAATCCACCCTTACTTGACGATGAAGAACCTAAAGGCGATGATTCATCTATGAAAATTGAAGATTTAGAACCTGTTGAAGACACAAACGATAAAATACGAAATATAATGCTAATGAGTGGGGTCGAATCACCTGTGATTGTACCATTTGAAGGCTTTAGAGAACGCTTACAAGCTGAAGAGGAAGCACGACATCATGTACCTAAGGACAGTATCATTAATTATGATAAAGAAAAAAAATCCTTGAACGCAAATAACAATCAAGAAAAGCCAGTTAATGAACTCCCAGATGAAGAACGGTTATTGGCTCATTTTCGTAAATACAAAATAAAACCACCGCCCTTCACAGCGGAATACTTGACTGCTAACAGATTCTCACCATTGGATGAAGAAATAAGATCGAATGCTCTGGAAAAATACAAGCAAAGCTTTCTAGAAAAGAACTTCCCTTTTGAATATGAAAACCCAGAAGATCTTTCAGAAGCAAGGAGCTATGTAGAAACCCCACCTAGCGAATTAAATGGAGACGAAGGAACAACTAATGAAAAGGAAAACAATTCCAAAGAAATAAACCCAAAGAACATGGAATATTTAATGAACTATTGGCGTGAAATTGTTGGTGCAAAATTAAAACCTCAAGAAAATTTATATGCTGAAGGAGGTCCATTAAAAACGGATGAACTGCAAGGTGAAAATTCAAAATTTTATTTATCTCAAGATTTGCAAGACTTAGTTAATAGAGAATGGGGATTTAAGCGTAGGGAAAGAGATGATGTTAAAAAGCCTGGGCCGCGTGTGGACGCAAAAGCATTAAAGATTTTATACAGCAATAAATCAGTGACAGCCCAATCATCTAATCAGAATCAGATTATATCGGACCACGATCACAACGATTACGACTACGATCCATCTTACGCGTTTGTAACTTTTCACAATAGGTTTTTGACAGACTGGGAGAAAGGTATTTCATTCATAACACGTCTTGAAGAGATGTTGGGCTTAGAAAAAAATACGTTTACAAATCCCCGAGTCGATCCCAGCGAAGTCACTTTTAAAGTAGAAAAAAATAGCAAAGGCTACGATGCAGCAGATGTTGCTAAGCAAATTGACGTTATCAAGGAAAAAGTACGTAAGGACACTGGAGCACAAATACAATCGGCTGGAGTTGGAGATAGGAGCAAATATCCAATGATTCGTAACTCCGAGTCCAAGGAGAATCAACTATTTGGTTTGGATTATCCAGTACTACTAGCACTTGTGGGTAGTTTGTCAGTTCTTATCGTGGGAGCAGTGGTGTTTGCTGTTTTGTTGAAGAGGGATATGAGTGCTAGGCGGAAGATGCAGGGCTTGGCTTCAGCAGCTGAGATCGACGCTGAGGCTACAAGGGATTATCAGGAACTTTGTCGTGCTCGCATGTCCGGTAAATGGACGGGCACGCAGACCGCAGTCGCTCCTCCAACTGAACCTCCGCAAAGGATTACGTCGCTATCACGTGACCCAGACGGGAATTCACCCTCTACTAGATCAAGCACTTCATCTTGGAGTGAGGAACCGGCTTTGACTAATATGGACATTTCCACTGGACATATGGTTTTGGCTTACATGGAAGACCATCTCCGAAACAAGGATCGCCTGGAACAAGAATGGCAAGCGCTTTGCGCTTATGAAGCTGAACCATGTGCTACCGCAGCGGCCCTGAAACCTGAGAATAACGGCAAGAACCGTTGCGCCGATGTCTTGCCTTACGACCATTCTAGAGTCATACTCAACACTCTCTCCAATCACCTTGGATCTGATTATATCAACGCATCTACGATAACTGACCACGACCCACGTAACCCGGCCTACATAGCGGCAGCTGGTCCATTGGTGCAAACAGCTCCGGATTTCTGGCAAATGGTATGGGAACAAGGCAGTGTAGTCATGGTGATGTTAACCCGCCTCACTGAAAACGGACAACAGCTCTGTCATCGATATTGGCCTGAAGAGGGTTCAGAACTGTACCACATTTATGAGGTCCATCTCGTGAGCGAGCACATTTGGTGTGACGACTATTTGGTCCGAAGCTTCTATCTGAAGAACCAACGTACTGGCGAAACTCGTACTGTCACACAGTTCCACTTCCTCTCGTGGCCCGAGAATGGAGTACCAGCTTCTACCAAGGCATTGCTTGAGTTCAGAAGGAAGGTTAATAAGTCTTACCGCGGAAGATCTTGTCCGATTGTTGTCCATTGCAGTAATGGAGCCGGTCGAACCGGTACATACTGTTTGATCGACATGGTTCTCAACCGCATGGCTAAAGGTGCAAAGGAAATTGACATCGCCGCTACTTTGGAGCACATCCGCGACCAACGCACACGCACTGTCGCTACCAAACAGCAGTTTGAATTCGTACTGATGGCTGTTGCAGAAGAGGTACACGCTATACTAAAAGCCTTACCAGCCCATCTACAACAGCTGCAGGAGAAGAAGGACAAAGAGAAGGAGAAAGAAAAAGGATCAGAGAAAGAAGGCACTGATAAAGATAAACCAAACTAA

Protein sequence:

>DPOGS212132-PA
MAQGDKFGGAPRSEVGVSQEVVVQRSTAGKWHRVNGGAHDRYSGVRRSHQLSTAVVFASYRASRSKRRHALGRINYHGYVPAFLADLNDVMSRTCYRQALWALAVICTLAPSNADGNIGCLFSSSLCIDGAEWCYDDFAFGKCIPIYDNDPEEGSLYQYDMSSTQLQWFERELQQLAAQGYRWEHAFTQCMLQSMLYALRHHLDPNQVNSKLCEHFADPKLSAGVTNVGDETLDANSDETAYIRFVPNTKLIDSDYANEVYNPPLLDDEEPKGDDSSMKIEDLEPVEDTNDKIRNIMLMSGVESPVIVPFEGFRERLQAEEEARHHVPKDSIINYDKEKKSLNANNNQEKPVNELPDEERLLAHFRKYKIKPPPFTAEYLTANRFSPLDEEIRSNALEKYKQSFLEKNFPFEYENPEDLSEARSYVETPPSELNGDEGTTNEKENNSKEINPKNMEYLMNYWREIVGAKLKPQENLYAEGGPLKTDELQGENSKFYLSQDLQDLVNREWGFKRRERDDVKKPGPRVDAKALKILYSNKSVTAQSSNQNQIISDHDHNDYDYDPSYAFVTFHNRFLTDWEKGISFITRLEEMLGLEKNTFTNPRVDPSEVTFKVEKNSKGYDAADVAKQIDVIKEKVRKDTGAQIQSAGVGDRSKYPMIRNSESKENQLFGLDYPVLLALVGSLSVLIVGAVVFAVLLKRDMSARRKMQGLASAAEIDAEATRDYQELCRARMSGKWTGTQTAVAPPTEPPQRITSLSRDPDGNSPSTRSSTSSWSEEPALTNMDISTGHMVLAYMEDHLRNKDRLEQEWQALCAYEAEPCATAAALKPENNGKNRCADVLPYDHSRVILNTLSNHLGSDYINASTITDHDPRNPAYIAAAGPLVQTAPDFWQMVWEQGSVVMVMLTRLTENGQQLCHRYWPEEGSELYHIYEVHLVSEHIWCDDYLVRSFYLKNQRTGETRTVTQFHFLSWPENGVPASTKALLEFRRKVNKSYRGRSCPIVVHCSNGAGRTGTYCLIDMVLNRMAKGAKEIDIAATLEHIRDQRTRTVATKQQFEFVLMAVAEEVHAILKALPAHLQQLQEKKDKEKEKEKGSEKEGTDKDKPN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: