MonarchBase - Protein-coding gene

DPOGS204114
Transcript	DPOGS204114-TA	3585 bp
Protein	DPOGS204114-PA	1194 aa
Genomic position	DPSCF300184 - 115857-125092
RNAseq coverage	90x (Rank: top 63%)

Annotation
*Heliconius*	HMEL012907	0.0	70.87%
*Bombyx*	BGIBMGA013603-TA	2e-152	55.03%
*Drosophila*	CG6729-PA	9e-44	27.21%
EBI UniRef50	UniRef50_E9I9E8	2e-115	37.98%	Putative uncharacterized protein (Fragment) n=2 Tax=Arthropoda RepID=E9I9E8_SOLIN
NCBI RefSeq	XP_001122102.1	4e-112	37.75%	PREDICTED: similar to CG6729-PA [Apis mellifera]
NCBI nr blastp	gi\|322802435	9e-115	37.98%	hypothetical protein SINV_02437 [Solenopsis invicta]
NCBI nr blastx	gi\|322802435	8e-114	38.29%	hypothetical protein SINV_02437 [Solenopsis invicta]

Group
KEGG pathway
InterPro domain	[267-549] IPR019354	1.4e-53	Smg8/Smg9
Orthology group	MCL12986		Single-copy universal gene

Nucleotide sequence:

>DPOGS204114-TA
ATGACTACGGTATTCTCAATTAAAGATATTCCAGAATTTTCACAAAAGGAAAAGATTGTAGTAGTAGGCATTATTGGAAAATCGCCGTTTCGATATCCAAATAAGACATCACCACTGCTTTCTTCAGTACAATTTAAAGAAAATGACATAGAATGCCATTGGGATGAAAGACGGAGTATTTTATATCTTCATGCAGTCACTTACTTCGACACTGCGAGATTGGCAGCATTGGCAGCAGATTTGAATGAGGAATCTCAGAGCACGGTCAAAGATGCTGATGCTGCTCACTGGCTTGTGGCTTCTGGAGAGTTGGCGATAGATGCATGCAGGGCTATGGCATTGATATTTCATTTGTGCCATATTGTGATTCTTTCATTACCAACCCCTGTATTTGATCTTGGATATTTACAGCTTTTTAAAGCTATTGATGCTTACAGAACAGAGGTATCAGCACAAATTACAAGCGCTTTACACCAATCATGGGCAGCTGCTTGGCAGCATGGTCGGTTATGCTGTCCTCGGCTGCTATTTCACTTCAAACGAGCCCCCACTCCACTTAGAGCTGATCCCGCTGGCCTGAAGAGATTGGAACATGCTGTGGAGGACCAGATATACTTCATACTCCGGAAGTCCCGACTTATAACTAATGTCTGTGCCAAATCTCTATTTGCTATACCTAAGAATGAGGAGTTTGTGTATATAAGCGCTGAGGAGGTGGGATCGGCTCGCGACACTAGTTCGTTACTCCGTGGCTTGGTGCAGATGTGTTCCGGTTCAGGCGCCCCAACATCATCAGACCGACCCAGCTTCAGACATTTCCTTCAAGGTCACCTGAATTTAGCTTTCGGCGAAGGCTTTGACGATAATGTTGGCAAGTACGCCATGAGCACGTCATATTTTGAGCTACCCTCAGCATCATGTTGGCGGGGCGCGGCACGTGTCTTACACCGTCAATACTCCCAGCAGTCGACCGTCCTCTTCGACGCCCTGGCCACAGACGTGAGGTTCTCTCAGGCCAGATGCGCGAAGGTGTTACCCATAGCACAGGCCTCCTACGCGGAGGGACTGCCTCCTCACTACTCCAGCCAGCACCACGCGCATAAGCTGGTGGTAGCGCTCGGTGTAGTTGAGGCGATGGCCCGAGGTCCCCTCGCTGGCGGTGCCCGAACTCGACTTCGGGCCGCCTGCGACACCATCAGACGAGCTAGGGAACTGTGCGAGGAACCCAGCCTCACACACCACCCTTGTATACATCCCAAACACGACAGTTCCAAAGAGCATTCATCGGGAGTGCGTTATGTGAGTGCGTGCAACTGCGGCCGCACGCGTGTGTCACGCGACGACCCGTACTGTGCGCGATCAGCCAACTTCACCTTCTACACCCTGGCCGCTGAGCAGTGCAATTGTGACACCTTACAAGCGATCAGCTTCCCCGTCTTTCAACCTTCAACCCCTACATTCAGGGCAGCGTCAGTTAAAGGTGCTACTGTTAAAACTCAAGAGTTGTCCGAAGTACGACAGCAGTTAGAGGTCACGGAGGCCGAGTCACCCCAAGGGGAAGGCTCGCAACGAGGCTCCTGGTCACCCCCAGACGTGCTGTCACCTGGATCAGCGAGGGACGAAGATGAAGAGGATCCTGAGGATTCCAGCGATGAAGGAATAGAGGTCGTCACAGTACAGGATAACGGCACTACAGGCACAACAGAGGTATCAGCACAAATTACAAGCGCTTTACACCAATCATGGGCAGCTGCTTGGCAGCATGGTCGGTTATGCTGTCCTCGGCTGCTATTTCACTTCAAACGAGCCCCCACTCCACTTAGAGCTGATCCCGCTGGCCTGAAGAGATTGGAACATGCTGTGGAGGACCAGATATACTTCATACTCCGGAAGTCCCGACTTATAACTAATGTCTGTGCCAAATCTCTATTTGCTATACCTAAGAATGAGGAGTTTGTGTATATAAGCGCTGAGGAGGTGGGATCGGCTCGCGACACTAGTTCGTTACTCCGTGGCTTAGTGCAGATGTGTTCCGGTTCAGGCGCCCCGACCTCATCAGACCGACCCAGCTTCAGACATTTCCTTCAAGGTCACCTGAATTTAGCTTTCGGCGAAGGCTTTGACGATAATGTTGGCAAGTACGCCATGAGCACGTCATATTTTGAGCTACCCTCAGCATCATGTTGGCGGGGCGCGGCACGTGTCTTACACCGTCAATACTCCCAGCAGTCGACCGTCCTCTTCGACGCCCTGGCCACAGACGTGAGGTTCTCTCAGGCCAGATGCGCGAAGGTGTTACCCATAGCACAGGCCTCCTACGCGGAGGGACTGCCTCCTCACTACTCCAGCCAGCACCACGCGCATAAGCTGGTGGTAGCGCTCGGTGTAGTTGAGGCGATGGCCCGAGGTCCCCTCGCTGGCGGTGCCCGAACTCGACTTCGGGCCGCCTGCGACACCATCAGACGAGCTAGGGAACTGTGCGAGGAACCCAGCCTCACACACCACCCTTGTATACATCCCAAACACGACAGTTCCAAAGAGCATTCATCGGGAGTGCGTTATGTGAGTGCGTGCAACTGCGGCCGCACGCGTGTGTCACGCGACGACCCGTACTGTGCGCGATCAGCCAACTTCACCTTCTACACCCTGGCCGCTGAGCAGTGCAATTGTGACACCTTACAAGCGATCAGCTTCCCCGTCTTTCAACCTTCAACCCCTACATTCAGGGCAGCGTCAGTTAAAGGTGCTACTGTTAAAACTCAAGAGTTGTCCGAAGTACGACAGCAGTTAGAGGTCACGGAGGCCGAGTCACCCCAAGGGGAAGGCTCGCAACGAGGCTCCTGGTCACCCCCAGACGTGCTGTCACCTGGATCAGCGAGGGACGAAGATGAAGAGGATCCTGAGGATTCCAGCGATGAAGGAATAGAGGTCGTCACAGTACAGGATAACGGCACTACAGGCACACTTTTTAAATTTCATTCATCAGGACTACCGGAGCATCTTCAGCCTGGTTTCCTGCCTCACACCAACTACCTCTTGCCGTGGGATTGTGCCGTGCGCCTGGAGCGTCCCGAGCGAGGGGACCTGGGGGTATGGAGGGGCAGGGGCAGGGGGAAGGCCCCCTCGCAGAGCCTTACAGTCAAGATATTCATAGGATACGAATATGAGTGTCCAAGAGGGCACAGGTTCATGATGTCGTCACCCGACACGGTGGTGTCAGGGGGCTCAGGGTGGTCCCGGGAGGCGGGCGAGGCCGGCGCCGGAGCCCTGCTCGCCTCCAGCTCCATGCCAGTGTTGTCCTCGTGTTTATGTCGAGCGGCCCAGCCCGCACACCTCGCACGACTGCACGTCGTCACACCGAAGGCTTCTATACACGTCACGCTCGACCCTAAGGTGCAGCCAGTCCCAGGCGGTCCAGTGTTCATTCCTCAGCCGGTCGGATCGCCGCCCATCAAGCTGAGCTCCTCAGCCTATTGGGTGCTTCGGTTCCCGTACGTGTATGCCCACGAGCACGGCGCTCTGCCCCGAGCGAGACTCCCGCCCGCCGGAAATGTTCTTCAACCAATGTTCGGACTACAGGAATAA

Protein sequence:

>DPOGS204114-PA
MTTVFSIKDIPEFSQKEKIVVVGIIGKSPFRYPNKTSPLLSSVQFKENDIECHWDERRSILYLHAVTYFDTARLAALAADLNEESQSTVKDADAAHWLVASGELAIDACRAMALIFHLCHIVILSLPTPVFDLGYLQLFKAIDAYRTEVSAQITSALHQSWAAAWQHGRLCCPRLLFHFKRAPTPLRADPAGLKRLEHAVEDQIYFILRKSRLITNVCAKSLFAIPKNEEFVYISAEEVGSARDTSSLLRGLVQMCSGSGAPTSSDRPSFRHFLQGHLNLAFGEGFDDNVGKYAMSTSYFELPSASCWRGAARVLHRQYSQQSTVLFDALATDVRFSQARCAKVLPIAQASYAEGLPPHYSSQHHAHKLVVALGVVEAMARGPLAGGARTRLRAACDTIRRARELCEEPSLTHHPCIHPKHDSSKEHSSGVRYVSACNCGRTRVSRDDPYCARSANFTFYTLAAEQCNCDTLQAISFPVFQPSTPTFRAASVKGATVKTQELSEVRQQLEVTEAESPQGEGSQRGSWSPPDVLSPGSARDEDEEDPEDSSDEGIEVVTVQDNGTTGTTEVSAQITSALHQSWAAAWQHGRLCCPRLLFHFKRAPTPLRADPAGLKRLEHAVEDQIYFILRKSRLITNVCAKSLFAIPKNEEFVYISAEEVGSARDTSSLLRGLVQMCSGSGAPTSSDRPSFRHFLQGHLNLAFGEGFDDNVGKYAMSTSYFELPSASCWRGAARVLHRQYSQQSTVLFDALATDVRFSQARCAKVLPIAQASYAEGLPPHYSSQHHAHKLVVALGVVEAMARGPLAGGARTRLRAACDTIRRARELCEEPSLTHHPCIHPKHDSSKEHSSGVRYVSACNCGRTRVSRDDPYCARSANFTFYTLAAEQCNCDTLQAISFPVFQPSTPTFRAASVKGATVKTQELSEVRQQLEVTEAESPQGEGSQRGSWSPPDVLSPGSARDEDEEDPEDSSDEGIEVVTVQDNGTTGTLFKFHSSGLPEHLQPGFLPHTNYLLPWDCAVRLERPERGDLGVWRGRGRGKAPSQSLTVKIFIGYEYECPRGHRFMMSSPDTVVSGGSGWSREAGEAGAGALLASSSMPVLSSCLCRAAQPAHLARLHVVTPKASIHVTLDPKVQPVPGGPVFIPQPVGSPPIKLSSSAYWVLRFPYVYAHEHGALPRARLPPAGNVLQPMFGLQE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: