MonarchBase - Protein-coding gene

DPOGS212134
Transcript	DPOGS212134-TA	3093 bp
Protein	DPOGS212134-PA	1030 aa
Genomic position	DPSCF300038 + 47682-63426
RNAseq coverage	364x (Rank: top 33%)

Annotation
*Heliconius*	HMEL004985	70.26%
*Bombyx*	BGIBMGA006584-TA	75.93%
*Drosophila*	CG42450-PA	60.45%
EBI UniRef50	UniRef50_E0W0J6	58.48%	Regulator of G-protein signaling, putative n=2 Tax=Neoptera RepID=E0W0J6_PEDHC
NCBI RefSeq	XP_001602584.1	62.79%	PREDICTED: similar to regulator of g protein signaling [Nasonia vitripennis]
NCBI nr blastp	gi\|383857974	61.51%	PREDICTED: regulator of G-protein signaling 7-like isoform 1 [Megachile rotundata]
NCBI nr blastx	gi\|345482134	43.76%	PREDICTED: hypothetical protein LOC100118674 [Nasonia vitripennis]

Group
Gene Ontology	GO:0004871	3.3e-42	signal transducer activity
	GO:0007186	3e-18	G-protein coupled receptor protein signaling pathway
	GO:0005834	3e-18	heterotrimeric G-protein complex
	GO:0035556	9e-15	intracellular signal transduction
KEGG pathway	oaa:100078978	7e-100
	K13765 (RGS9)	maps->	Phototransduction
InterPro domain	[412-528] IPR000342	3.3e-42	Regulator of G protein signalling
	[405-539] IPR016137	3.1e-37	Regulator of G protein signalling superfamily
	[112-204] IPR011991	7.3e-19	Winged helix-turn-helix transcription repressor DNA-binding
	[332-393] IPR015898	3e-18	G-protein gamma domain
	[401-443] IPR024066	1e-15	Regulator of G-protein signaling, domain 1
	[124-202] IPR000591	9e-15	DEP domain
Orthology group	MCL13084		Single-copy universal gene

Nucleotide sequence:

>DPOGS212134-TA
ATGACATCGGTAGATGAATTCGTAAACTCATCGGCATGGCTTATCAAGGTATTGATAGTGATAATCGTGATAGTAAGTGTGTGCGCAGATGTTTTTAACATTACGTATGTACATTTAGACCGTCCGTCAAAGAGATCGCGTCCCCACTATAAGCTTGCTCTAACGAAAGCGATAAAGGTGTCGGGGGCGCAGCGTGGGCGCGAGCGGCATGCGGCCCCCGCGACAGACTCCCATGGAGGTAGGATAGCGCGCGGCCAGCCGCGCCCACTGCCCCTGCTCACCGCGCTCGCCATGGAACCCGCGGATGTGCCGAGGCACAGACCCCTCGCATTCGATAAGATGGAAAGCTTGATTAAAGAAATGCAAGATCCGGACACGGGTGTACCAGTTCGAAGTCAAAAACTTTTTCTGACCTACGTACCTTCTGCGTTTGCAGCGTCAGACGTTATCGAATGGATTATGGAGCGGTTTAACGTAGACGATTCTAACAACTCGGAAGGATTGATTTTAGCAAATCAGCTCTGTCAATATGGTTACCTCTTTCCTGTCAGCGATTCAAAAGTCCTTGCATTAAAGGATGACAATTCTCTTTTTAGATTTCAAAGCCCATACTACTGGCCGTGGCAAGGTCCCCGGGTGGCCGGAGCTGGGTCGGGCGCGCCAGCCCTGGGGCCCGATAACGTCGAGTACGCAATCTACCTCGTGAAACGCACATTACGCAATAAACAGCGTCACGGCCTGGAGGAGTATGAACAGGAAGCGCTCGCGAACCTCAAGAAGAACCTTGCTGCTAAATGGGACTTCATTACTATGCAAGCGGAAGAACAGGTCCGGTTGGCCAAAGAGCGCAAAAAAGGTGACAAGATAGTAAGCGATAGTCAGGAGAGAGCGTACTGGCGTGTGGCTAGACCGCCGCCGGGGACGCTCACGGCGCTAGAATCCTGTCCGGTGCCAGTTCGCGCTCGACACCCGACCAAACCTAAGAAGAGAACCATACAGCAGATCACGAGAGAGATTGAACACTTAAAGGCTAGCCTGGATCGTACGCGTGTGAAGACCTCAATTGCCCTCGAAGCTCTAATGGCTTATTCGGAGACCTTCGCCGCCTATGATCCCTGGCTCACACAGCCTCAGCCCTCGAATCCTTGGATTACGGATGACACTCTCTTTTGGCAAATCAACAGTCCCATTGTTGAAGTACCGAGCGAGAAACGTGTTCAGCGTTGGGCTGTTTCTATAGAGGAATTAGTATCAGACCCTACTGGTCTTCAGGAGTTTACGAGTTTCCTTAGAAAAGAATATTCTCACGAAAATATTCGATTTTGGTTAGCTGTTATGGACCTTAGAAGAAGTAGTACTAAGCAAATACCTAAGAAGCTTGAAGAAATATATGAGGAGTTTTTAAAGCCAGGCGCGCCCTGCGAAATCAATATCGATGGAGCGACGGCGGATCGTGTTACGGAAGGTATCCGCAGTGGATCGCGATACGCTCTGGATCACGCGGCTGATCATGTTTACGGATTGCTATTGAAAAAGGATTGCTATCCACGATTCATTAGATCGGATCACTTCCAACGGCTGTTGGCTGAGGGTAGAAATGTACATCAAAAGAAAGCTAAATTTTTCAATTTTGGAGGTCAAGTAAAGAAAAAGCCGGGATCTACGAGTGGCAGTAGCGGTAGTGGAGCACTGACTAGGAGACGCGGCTCTGATCGTTCGTTATCGGGTTCTGCGCATGAGCTAGCCGTCTGCGCCGCCCAACCACCTCGAGCTCCCGAACCGCCCCCGCACAGCCACTCACAGTCTAACCTCTGTGATATCCCGTTCAGGGATCCTTTGGACGACGACACGGCAGACGTCCTCCCCTGGGAGAATTCTACTCGGGATAGTGGATACGGGGCGAGGCGAAGGCAGGACTCCACCGCTGACTCGGGCAGTTCGTCGTCGGATGTGAGCGCTGCGTTGGCGACGAGCGAACGACGGCGACTCCCTCAGCAGAGCACGCTGGATGGTGGACTACGAGGCGCCCCGCCGCCTCTCCGCCGCTTATCCGCTGTAGAGCCGCGCCACCTCGCGCCATTGTCGTCACCGCCACATTCACCGCGTCACACGCGGGCCCACCAGCCGGCGTCACAACCAATACACGCGCCCGTCCCACCTCACCATCCCACCCCCACTATCAGCGTTAGCTCTGCACCGGATGACGAATCCGCCGAATCACCAACCAGAACAGGTTCTCCCGACGACAGGCGCTCGATCGCTCACTCCGAGGAACCTTCTTCAGTTTTTGCGTCGGCGGACGCTACGCCCACAGAACACTCGCTCGCGTTCACAGACAGATGTCCAACGGTGGATACTGCGACGGAAGTTGTTGACACGAGGACTAATGTTTTGAAAGTGGAAGTGAGAACAGCGTCTTTCGAAGCGTCGCTCGCCGCCGAGTCGATTGACTCGTGTGACGAAACCCGCTCGGAATCGACGATAGGTTCAAGTCGGAACTCTAAAATTCAATCGCGGGATAATTCGAAAGACGAGCAAGTGCTGTCTGCTGAAAACGAAATATTTGTGCGTATACCGATACCGCAGGGAGTTCCCGAGACGATTCCAACACTTGTTAAGGCGTCGTCTTTCAGCAAGGAAGAAGAACCTACACGAAATGTCGCCCTGAGTCGGTCCGATAGCGAAGTCACCGGTGTTTCAAAATCAGTTGAGGCGTCTGCAACGGAGTCAATAAGAGACGCTTCCGAGTCGCCGGTGATGGCAGCCGCGCCTGCGGAAGCGCAAGTCGAGCGACGGGTCGCGGTCGCGCCGCTCGCTGTGTGCGAGGATGTCGGCGTGGACGAGGACGCGGTCGACAAAGTGCTTCCGGTGCAGAGGGTCTCCACGTATCCGAAGGCGTCAGATTCCAATGTGGTGAAATTTGCTCATAGTGACGAACTGTCGTCGGTATCCGAATCCGACATTGTTAAATGCGATAAAAGCGCAGTCAGTGAACGTAAGCAGCGGAACGACATTTGTCCCTGGGAGGACGAGAATTGCTGCGAGAGTGACGTTCCATTTGTTAAAACTTACGCAACGCTCGGTTACTTATAA

Protein sequence:

>DPOGS212134-PA
MTSVDEFVNSSAWLIKVLIVIIVIVSVCADVFNITYVHLDRPSKRSRPHYKLALTKAIKVSGAQRGRERHAAPATDSHGGRIARGQPRPLPLLTALAMEPADVPRHRPLAFDKMESLIKEMQDPDTGVPVRSQKLFLTYVPSAFAASDVIEWIMERFNVDDSNNSEGLILANQLCQYGYLFPVSDSKVLALKDDNSLFRFQSPYYWPWQGPRVAGAGSGAPALGPDNVEYAIYLVKRTLRNKQRHGLEEYEQEALANLKKNLAAKWDFITMQAEEQVRLAKERKKGDKIVSDSQERAYWRVARPPPGTLTALESCPVPVRARHPTKPKKRTIQQITREIEHLKASLDRTRVKTSIALEALMAYSETFAAYDPWLTQPQPSNPWITDDTLFWQINSPIVEVPSEKRVQRWAVSIEELVSDPTGLQEFTSFLRKEYSHENIRFWLAVMDLRRSSTKQIPKKLEEIYEEFLKPGAPCEINIDGATADRVTEGIRSGSRYALDHAADHVYGLLLKKDCYPRFIRSDHFQRLLAEGRNVHQKKAKFFNFGGQVKKKPGSTSGSSGSGALTRRRGSDRSLSGSAHELAVCAAQPPRAPEPPPHSHSQSNLCDIPFRDPLDDDTADVLPWENSTRDSGYGARRRQDSTADSGSSSSDVSAALATSERRRLPQQSTLDGGLRGAPPPLRRLSAVEPRHLAPLSSPPHSPRHTRAHQPASQPIHAPVPPHHPTPTISVSSAPDDESAESPTRTGSPDDRRSIAHSEEPSSVFASADATPTEHSLAFTDRCPTVDTATEVVDTRTNVLKVEVRTASFEASLAAESIDSCDETRSESTIGSSRNSKIQSRDNSKDEQVLSAENEIFVRIPIPQGVPETIPTLVKASSFSKEEEPTRNVALSRSDSEVTGVSKSVEASATESIRDASESPVMAAAPAEAQVERRVAVAPLAVCEDVGVDEDAVDKVLPVQRVSTYPKASDSNVVKFAHSDELSSVSESDIVKCDKSAVSERKQRNDICPWEDENCCESDVPFVKTYATLGYL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: