MonarchBase - Protein-coding gene

DPOGS203118
Transcript	DPOGS203118-TA	3003 bp
Protein	DPOGS203118-PA	1000 aa
Genomic position	DPSCF300094 - 58420-68397
RNAseq coverage	352x (Rank: top 33%)

Annotation
*Heliconius*	HMEL022127	0.0	94.54%
*Bombyx*	BGIBMGA001528-TA	0.0	89.82%
*Drosophila*	CG42251-PC	2e-48	46.22%
EBI UniRef50	UniRef50_UPI0001757D4E	2e-139	44.42%	UPI0001757D4E related cluster n=1 Tax=unknown RepID=UPI0001757D4E
NCBI RefSeq	XP_971667.2	4e-140	44.42%	PREDICTED: similar to CG11146 CG11146-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189233990	8e-139	44.42%	PREDICTED: similar to CG11146 CG11146-PA [Tribolium castaneum]
NCBI nr blastx	gi\|328780654	3e-158	37.89%	PREDICTED: hypothetical protein LOC550870 isoform 2 [Apis mellifera]

Group
Gene Ontology	GO:0005515	1e-26	protein binding
KEGG pathway	hmg:100201881	7e-11
	K07365 (NCK)	maps->	Pathogenic Escherichia coli infection
			T cell receptor signaling pathway
			ErbB signaling pathway
InterPro domain	[885-997] IPR000980	1e-26	SH2 motif
Orthology group	MCL16054		Insect specific

Nucleotide sequence:

>DPOGS203118-TA
ATGCCTTCAAATAAAAAGTTGATGGCCAAAATGAAACAAATAGCCCAGTGGATTTTGGTTGTCCATGTGGTTGAATTTATAGAAGCTTATTGCACACCACGCGACACAGCGAGAAGATCACCACAGCGTAGTCGTCGCTCGAGGGAGCCTCGTCGTTCCCCAGATACATCCCGATGGCGTTACGATTCTCGTCGCCACAACTACGACTTTGATACACGAAGACCATACGAGTACGAATCTAGGAAGTATTTCGGAAGAGAATACGACGCGGATTCGGGAAGACGACCAGCGTTTGACGCGGAATCAGCCCGTCGGCGTGCGGATTACGAATCAGCTCGAAGGACCGACTTTGATTTGTCCGCTCCCGAGGTCTCTAGGCGGAGTCCCGAAAGCGCACCAGAAGGTTCAGCAGATTCCCCCCCTGAACCAGCTCCTTCCGCTCCACTACGTCAAGAAAGACATTCAAGACATCGATCACAGCCATATTACGAATCTGAATCATCTTCAGAAGATCGATCATCTTCAACTGAGGAGGAAGACGAGTTCGGTGAATTAGATCCGTTCGCTACAGCACCTTCACTACACTCGCCGGACAGTGGACGTTCTGATCCCCGATACGCGAACGCACCCAGACGAAACCCAAGCCCTTATTATTACGGCGACCTATTTAAATCAGCGCCGCCACCCCCAGCTCCTTCAGCGCCAACTGTATCATCAACATCTTCATCACGTGGCCCTCGCTATAGGAAATCTGCGAGTCTCGACGCTCCACACGTCGCACAGAGACCAAATCTGCCTAAAAGGTTCTCCGTGGCAGAAGATGGCTTTCGTGAATTAGAGCGGTCATCATCATCGTCCGGTGAGAGCGCGTGGATGCCGCCGAGGCGCCGCGGGCGCGACGCGGCCGGCTGCGCATGCGCCGCGCCCGAAGATGTAGAGGAGCATAGGTCCTCGAGAAGTGTGTTCTACGTGCCAGCGCCATTGCCACGCTGGCCTCAAGAAATGACGACTCGACAGATATACGAAACAGCCTTCGACTGTAAAATAGCCCGCTCTGATGATGACTTGGACGACTTTGATCGTGTCAGCAATCATCCGGCCTTATTGCAAGCGGAAGAGCGGAAGGTGGTTTCTTCTGCATCATCAGCGTTTGAGGCTGTTGAACGGAGTGAACCTGACTACAAAGGCCGGCGTAAAGTGACCATGAAAACTGACAGCGTACGACGCTCTAAAATTCCTACGATACGACAAAAAAGAGAAAATGAAAGTAATGCTTCAGCGTTATCAGAAGAGCTAGAAAAAGTACACATTGAAGAAGAGGATCGTACTTCAACATCTCAACTTCCATTGCGCGGTTATACTCCATCACCGCCTTCTACGGCACCGTTACCCACGAAATTTCAGCAAAAGGATGGGTCTGCTATGAACAGTATTAAAAGTGCTCCAAATTTACCTCAAACCCAACCATCACATCCCCGCCTTAAAGATTTGCGGTTACCTGTTAAATCACTAAGAGCTCGTGAGACTCCAACCAGTAGTGATGCGAGTTTGACTGATGTGAAAGCCTCAGTATCAACTGAACTTGACGTTGGACAACGACTCAGGGATTCGAGCCGCGAATCCCGTGATGGTGACGACGAGAGGGTACAATCTAAAGACGGTATTTTTTTAGAGATTAAGGGTCGACCCACTTCCGATTCTGATACACCTGAAATGAATCGATATAAGGGCCCTAAAGGGGTCGGCCCTATAATGGAGTTCAAAGGTAGGCCCGGTGTTGCACGTCCACGGCGAAAATATTCGAGCACAGAGAGTATGGCTACTAGCAGCAGTGGTGGAAGCATGGAATCACTGCGAAGTAGCAACAGTGAGGGAGATAGAAGTAGTAGTAGCTCAGAGAGTAGACATTCATCGTCTTTGAGTTCACACAGCTCGGATTCTGGTAATGTGCCATTTGTTAAGTCACATCACATGCAACTATCGGGGTTTGGGCATCATCCTAATAAACTACACATTCTAAGTCCTATATCAGATAAATCTTCTCAAGAACCGGCTTCCGAAACATCTGATAATAACAAGAACAACAATTCACAGAAAGTTTCACCCGAAGACGCCGAAACTGGTAATGTAACAATGCAGACAACCGTTGAAATCTTACCCAAACCTAAAAGACGTGCTTTACAGAATAGAAATTTGCTAAACCTAACGTTCAGACATTCAACGCCTGGCGATACAGAAATCCAAGGATCAGATAGTGGAATATCAATACATTCAAGAGAAGGAGTTGATTCGAGAAATGCATTCGTTAACTTCAAGAACAGCAACACTGAAGAGGAAAGGAAAGATGAAGACGTTGATTTGTCTGATCTTCCATTCGATATGCCGAAACTGCGAAGACGTAGGGCTGAGGCCGAGGTTGACCTTAGATCTTTGCCCTTCGATATGCCCAAACTAAGACGTAAACTCCGCGGACAATCTTTACAATTAAATAGTGACTTCGGCGAAGCCATCTCTAATGCTTCATCCAGTCAAAGCGTACAAGACTTGAATCAAGATAAGAAACATCGCGATAAATTGACTTTGAACTTCGAAAGTGGCAGTGGTTCTGGTAGTACCAAAGGGTTGCATTTGAATCTGGGACCGATCGCTCCGCCACGAGACTTGATTGATGCCTCTCTTCCACTTGACCGTCAAGGGTGGTATCATGGAACGTTGTCGCGTTTGGAAGCTGAGGGTCTGTTGCGAGACGCGGACGAGGGAGCTTTTCTAGTACGAAACAGTGAATCCGCGAAACACGACTACTCCCTCAGCTTAAAATCGACACGTGGGTTTATGCATATGCGTATATGTCGTGGAGGTGAAGGTTATACTTTGGGAGGTGCGACTACCGCCTTCCCTACCGTTCCGGCTCTCATGAGACATTACGTCACAGCCCAAAGACTCCCTGTCAGGGGAGCTGAACATATGGCACTGTCCACACCACTGCCAGCTGTTATGCTATGA

Protein sequence:

>DPOGS203118-PA
MPSNKKLMAKMKQIAQWILVVHVVEFIEAYCTPRDTARRSPQRSRRSREPRRSPDTSRWRYDSRRHNYDFDTRRPYEYESRKYFGREYDADSGRRPAFDAESARRRADYESARRTDFDLSAPEVSRRSPESAPEGSADSPPEPAPSAPLRQERHSRHRSQPYYESESSSEDRSSSTEEEDEFGELDPFATAPSLHSPDSGRSDPRYANAPRRNPSPYYYGDLFKSAPPPPAPSAPTVSSTSSSRGPRYRKSASLDAPHVAQRPNLPKRFSVAEDGFRELERSSSSSGESAWMPPRRRGRDAAGCACAAPEDVEEHRSSRSVFYVPAPLPRWPQEMTTRQIYETAFDCKIARSDDDLDDFDRVSNHPALLQAEERKVVSSASSAFEAVERSEPDYKGRRKVTMKTDSVRRSKIPTIRQKRENESNASALSEELEKVHIEEEDRTSTSQLPLRGYTPSPPSTAPLPTKFQQKDGSAMNSIKSAPNLPQTQPSHPRLKDLRLPVKSLRARETPTSSDASLTDVKASVSTELDVGQRLRDSSRESRDGDDERVQSKDGIFLEIKGRPTSDSDTPEMNRYKGPKGVGPIMEFKGRPGVARPRRKYSSTESMATSSSGGSMESLRSSNSEGDRSSSSSESRHSSSLSSHSSDSGNVPFVKSHHMQLSGFGHHPNKLHILSPISDKSSQEPASETSDNNKNNNSQKVSPEDAETGNVTMQTTVEILPKPKRRALQNRNLLNLTFRHSTPGDTEIQGSDSGISIHSREGVDSRNAFVNFKNSNTEEERKDEDVDLSDLPFDMPKLRRRRAEAEVDLRSLPFDMPKLRRKLRGQSLQLNSDFGEAISNASSSQSVQDLNQDKKHRDKLTLNFESGSGSGSTKGLHLNLGPIAPPRDLIDASLPLDRQGWYHGTLSRLEAEGLLRDADEGAFLVRNSESAKHDYSLSLKSTRGFMHMRICRGGEGYTLGGATTAFPTVPALMRHYVTAQRLPVRGAEHMALSTPLPAVML-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: