MonarchBase - Protein-coding gene

DPOGS210730
Transcript	DPOGS210730-TA	1983 bp
Protein	DPOGS210730-PA	660 aa
Genomic position	DPSCF300013 + 105454-113503
RNAseq coverage	2109x (Rank: top 6%)

Annotation
*Heliconius*	HMEL016169	1e-96	71.37%
*Bombyx*	BGIBMGA006260-TA	2e-48	84.91%
*Drosophila*	CG17838-PB	2e-109	63.33%
EBI UniRef50	UniRef50_O60506	6e-61	49.79%	Heterogeneous nuclear ribonucleoprotein Q n=114 Tax=Eumetazoa RepID=HNRPQ_HUMAN
NCBI RefSeq	XP_002137140.1	7e-110	64.71%	GA27045 [Drosophila pseudoobscura pseudoobscura]
NCBI nr blastp	gi\|198450702	1e-108	64.71%	GA27045 [Drosophila pseudoobscura pseudoobscura]
NCBI nr blastx	gi\|307173250	4e-125	53.75%	Heterogeneous nuclear ribonucleoprotein Q [Camponotus floridanus]

Group
Gene Ontology	GO:0000166	3.6e-28	nucleotide binding
	GO:0003676	3e-21	nucleic acid binding
KEGG pathway
InterPro domain	[277-417] IPR012677	3.6e-28	Nucleotide-binding, alpha-beta plait
	[342-407] IPR000504	3e-21	RNA recognition motif domain
Orthology group	MCL10769		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210730-TA
ATGAGGCCTCGAGCCAACGAGCGTGACAGGCCGCTGTGTTACCACTTCCTACGTTCCCTATTGGACTCTCGAACCGTGGCGAGGTTGGTGGCGTCCCGCGCCCTTGTCTATAACAGCTTTGTAACCGGCACGATAGCTGACTGCGGTTTGGGGACTCGCCTCCTTGTACATTACCCTCGAGTGAAATCATTGGCGACGTCCGAGGCCTCGCTTAGGCTCGCTACCGCGACGGTTTTGCAGTTCAGGCTCGAGACATGGTCCGCTCCACACGTTCAGTGTCGCGCGCTCGGGGCACTGGTCGCGTTCGCTGTCGTGGATGGTTTCACTCGCAAACCGAAGTCTCCAAACTGCAGCGCGTCTTGCAGGCCTACCGCCCGCCCAGCGACGGTAGTCTCGCAAGACGCGCATGTCATTAATATCCCCATCGACTTCGGCCATAAATATGCGGAGTGTGACGTCGCGACGGCCCGGCGGCCGGCCCCGGGCGCGGCGCCGCGCGTATCTATGGCCGGAGTCCCCACTGTAATCACTGATCTTGTGTACATGTGCAACGTAACACCCCTCGATAATCACGAAATAAAACCGGGGAAGACTCTGAGAATTAAGATTAGCGTACCGAACCTTCGACTTTTCGTCGGCAACATTCCCAAGTCTAAAGGCAAAGAGGAGATACTGGAAGAGTTTGGTAAATTAACAGGGGAAAAAGATTGGCGTTACGCACGTCCGCGCCGCGCCCGCGCCCCGCCCGCGCCCCGCCGACCCGCCGTAGTCGCTAACATGACATTGGCCTCCGCCTCGAGAATGCTCACTGCCGGACTCGTTGAAGTCATTATATATAGTTCGCCCGATGACAAGAAGAAAAATAGAGGATTTTGTTTTTTGGAATACGAGTCTCACAAAGCGGCGTCACTAGCCAAGCGTCGGCTGGGCACCGGCAGGATTAAAGTTTGGGGCTGTGATATTATAGTGGACTGGGCGGACCCGCAGGAGGAACCCGACGAGCAGACCATGAGCAAAGTGAAGGTGTTGTACGTTCGGAACCTGACCCAAGAAATCACAGAAGAAGCGCTTAAAGAAGAATTCGAACGTTATGGAAATGTAGAACGAGTTAAGAAAATTAAGGATTACGCTTTCGTACACTTCGAAGACCGGGATTGTGCCGTTAAGGCGATGCAGGAGATAGACGGCAAGGAGCTGGGTGGAGCCCGCCTCGAGGTGTCGCTGGCCAAGCCACCCTCGGACAAGAAGAAGAAGGAGGAGATACTGAGGGCGAGGGAGAGACGCATGACGCAGATGATATACGGACGGGGCGGATTTGATTGGTGCAGCTGCTCGCCGGTGCACGGGGCGCTCCGGGGCCGCACGCCGCAGCCGCAGCCGCGCCCGCCGCAGGCCCGCGGGGACTACGATTATGATTACGACTATTACGGGTACGGGGATTACCGAGGTGGCTACAATGAGCCATTTTACCGGTACGATGAGTTCTATTTTGATTACGCGGGGCCACCGCAACCGTCCGCCGTCCGCCAGCCTCCCAACAGAGCGCAGCCGCAAAGAATTGTGATTGAGAGTGTGCGAGTAGTATCCACGGCCGGTCGTTCAGAGCGAGCGATGTCCGGGGCCGAGCTGACTCCACTGTGTGTGATGTCCAGGGGGCTGGGTCATGTGGGACGGGCGCGCGCTGGGGGCGGCGCGGGGCCGCGGCTGGGGCCCGTGGTGGTGCGCGCCGCGCCGCTCGTGGCCGCCGCACGCCCAGCGGCATGCGTGGCAACCCGCGCGCCAAGCCAAGTTTACCAGGTACGTACACGGGCACAGGAACAGACACGACGTAAACGTAAACTCGACGGGGGTCAGCAGATCGCTGGGGGGGAGCGGGAGAGCAAGCGGCGACTGGGCGCGGCGGCGGCGGCGGCGCGCGGCTGGGGGTCGGCGGGGGTAGGATCGATGGGGTCCATGGGGTCCGAAGGTGCCGCCGCCAGCTAG

Protein sequence:

>DPOGS210730-PA
MRPRANERDRPLCYHFLRSLLDSRTVARLVASRALVYNSFVTGTIADCGLGTRLLVHYPRVKSLATSEASLRLATATVLQFRLETWSAPHVQCRALGALVAFAVVDGFTRKPKSPNCSASCRPTARPATVVSQDAHVINIPIDFGHKYAECDVATARRPAPGAAPRVSMAGVPTVITDLVYMCNVTPLDNHEIKPGKTLRIKISVPNLRLFVGNIPKSKGKEEILEEFGKLTGEKDWRYARPRRARAPPAPRRPAVVANMTLASASRMLTAGLVEVIIYSSPDDKKKNRGFCFLEYESHKAASLAKRRLGTGRIKVWGCDIIVDWADPQEEPDEQTMSKVKVLYVRNLTQEITEEALKEEFERYGNVERVKKIKDYAFVHFEDRDCAVKAMQEIDGKELGGARLEVSLAKPPSDKKKKEEILRARERRMTQMIYGRGGFDWCSCSPVHGALRGRTPQPQPRPPQARGDYDYDYDYYGYGDYRGGYNEPFYRYDEFYFDYAGPPQPSAVRQPPNRAQPQRIVIESVRVVSTAGRSERAMSGAELTPLCVMSRGLGHVGRARAGGGAGPRLGPVVVRAAPLVAAARPAACVATRAPSQVYQVRTRAQEQTRRKRKLDGGQQIAGGERESKRRLGAAAAAARGWGSAGVGSMGSMGSEGAAAS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: