MonarchBase - Protein-coding gene

DPOGS203564
Transcript	DPOGS203564-TA	2136 bp
Protein	DPOGS203564-PA	711 aa
Genomic position	DPSCF300055 + 599976-602503
RNAseq coverage	4x (Rank: top 89%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA008558-TA	7e-49	44.44%
*Drosophila*	Rcd1-PB	2e-18	27.56%
EBI UniRef50	UniRef50_Q9P2N6	7e-21	27.95%	Uncharacterized protein KIAA1310 n=81 Tax=Eumetazoa RepID=K1310_HUMAN
NCBI RefSeq	XP_395713.2	2e-20	26.82%	PREDICTED: similar to CG8233-PC, isoform C, partial [Apis mellifera]
NCBI nr blastp	gi\|348530440	1e-21	27.17%	PREDICTED: uncharacterized protein KIAA1310 homolog [Oreochromis niloticus]
NCBI nr blastx	gi\|71417943	3e-26	32.63%	hypothetical protein [Trypanosoma cruzi strain CL Brener]

Group
KEGG pathway
Orthology group	MCL21804		Lepidoptera specific

Nucleotide sequence:

>DPOGS203564-TA
ATGGCGATCGATCCGAGCTGTCTTCACGAACGGCTCGTGGAACACGTGAGAGCGGTCAGCGGCGAGCCTAACAGTCAAACCGGCGTTTGGGGCGAACACTCTTACGCGCGGCCCAGAGGCGTCGCCCCCGACCCGCTGATACGAACGCTGCTCGCGCCGCGGCCTTCCTCGCCCGACGAAGGAGACGTCTTGGATGTCGAGGGAAGTCCGCCCTCACCCCCCGGACTGCCCTTGGACGTGGATGACTCACGAGACTCTGAACAGGACGACCACGACGGGGACGACGAGGACTGGGAGAAACGAGTGGCGGCGCTCGCGCCCACGGCGGGGCACGCGCGGCTCGCGCGAGATGCGGCCGTCGCGCTCCGGGGGCTGCGACTGGAGCGGCTTGCGGGCCGGGGAGGACGGTGGGACAGGACGGATGGGGCGCGGGCCGCAACCAGGAGACTGAGACGAGCGCTCGCCTCGCACTGGACGAGCGGCGCCGCGGCCTGGCTCCATTCCACGATGACCACGAGTCTGCCTCGGTCGCTGAGGGCCCACTACGACGAGGTGCTGGCGGAGCTGTGGCGGACGGTGCCTCGCCTCGCAGAGCGCCTGGCCGCACCCCGACCCCTCGTAATCCAAAACGACCCTCTCGCCGTCGTCGGAGAGAGGCGGCCGGCGAGCGAACCCGGCCCGTGGCTAGCGTGGGCGCCGAGCGGCAGCGAGACGGAGGATGCGCGCTGGGTGAGGCGCCTCGGGGCCTTGATCCACGTGCGGGAGCTGGTCCCAGCCGCGCCGCACACGCCGGGCCTCGCCCCGGACCGGTGGTGCGCGACCCTGGCGCACGAGGCGCGAACCGCCCTCACCGAGCTGCTCTCGGAGGCCGGACGGAGGCCCGTGTTGCTGGGCGGGGCGGGCGCTGGCGCGGCTCTGGGGTCGTGGCTGGCGACGGGCGGGGCCGGCGCTCGTGTTCGCGGACTGGTCCTGCTGGCTCCGCCCTTGCTGACGGCCGAGGGTCCCCGAGACGCGGCGGAGGAGCCCGCGGACGAGCCGGACCTGCCCCTGCTGTGCGTCTCGGGGTCGGCGGGGGCGTCGTGCTGGCGGAGCGCGGCGGCCGAGCTGTGTCGCGGCGCTCCGCGGGGCGCGTGTCGCCGGGTGCTGGTGGTGTCGGGGGCGGACGACCGTCTCCGGCTGCCTCGCGCGTGTCGCCGTCGTCTCGGAGTGCCGCAGGAGGCGCTGGACGCGGCCGTGTCGGAGGAGTGCGCGCGGTGGTCGCTGGACGTGGCGGAATCGTCGCCGAAGGAGCGCTCCAGACGGAAGGAACTAAATATGAATAAATACAAAGCTCACATGTTCGTATTTTTCCAGTCGGCGAGGAGCACCGCGGAACACAGTGAGTATGTCTGTGTGTCACACACCGAGTCCTGGCCGGGCGTCGAGCTCGCTCGCCTCGGGGCCGGCGGTCTCACATACTCCTACAGACGTTCTATTCCCGACGTCTCTCTTAACGCCAGGGCGTATAAAACAATCGTTTCAATGATCGAACTCCGCCTGAGTAAAGCTATTAGCAAATGGACCATGTTACTTCCGCCAAGTGTCTCTACCACGAGTCAGTCTGATGTTTGGTCCCTGCATCGATTTTTTGGAATAAAATACACGTCGACCATCAACACTGGTTCTGTATCCAAAGCGCACAGTTCCTTCCGCGACTGTAGGCCACCGGCTCCCCCCCAGCTGTATTCCCTGCCCGCCACGTATCGTCTCACTCCTGGAACCGCTCATCTAATCCGAATCGTTTTCATGTCACAGGTCAAGCCGCTCCATCGAGATAAGGGTCGCGTGGTGCAGCGCGGGACCGGAGGCGTGGCTCTGGAGCTGCAGCCGCCGCGCCGCGCCAAGAGGTCGGAGAGGTCCGAGCAGGCGGGTGCGGAGGCGGGCGGCGAGGAGTCGCTGGCGGCCGCCGACATCATGCAGCTACCCATCGTGTTCGCTGACGACGAGCCCCCCGCGCCTCCCGCCGCCTCCGCCGCCCCCCTCGCCCTGACCGTGACGAGCGGAGCCCCGCGCGCCGTGCGGTACACGCGAGTCATCGTGGCCAAGAAGACGGCCCGCCGCCGCCACAGGCCGCCGCGCCCGGCCCTCGACCACTGA

Protein sequence:

>DPOGS203564-PA
MAIDPSCLHERLVEHVRAVSGEPNSQTGVWGEHSYARPRGVAPDPLIRTLLAPRPSSPDEGDVLDVEGSPPSPPGLPLDVDDSRDSEQDDHDGDDEDWEKRVAALAPTAGHARLARDAAVALRGLRLERLAGRGGRWDRTDGARAATRRLRRALASHWTSGAAAWLHSTMTTSLPRSLRAHYDEVLAELWRTVPRLAERLAAPRPLVIQNDPLAVVGERRPASEPGPWLAWAPSGSETEDARWVRRLGALIHVRELVPAAPHTPGLAPDRWCATLAHEARTALTELLSEAGRRPVLLGGAGAGAALGSWLATGGAGARVRGLVLLAPPLLTAEGPRDAAEEPADEPDLPLLCVSGSAGASCWRSAAAELCRGAPRGACRRVLVVSGADDRLRLPRACRRRLGVPQEALDAAVSEECARWSLDVAESSPKERSRRKELNMNKYKAHMFVFFQSARSTAEHSEYVCVSHTESWPGVELARLGAGGLTYSYRRSIPDVSLNARAYKTIVSMIELRLSKAISKWTMLLPPSVSTTSQSDVWSLHRFFGIKYTSTINTGSVSKAHSSFRDCRPPAPPQLYSLPATYRLTPGTAHLIRIVFMSQVKPLHRDKGRVVQRGTGGVALELQPPRRAKRSERSEQAGAEAGGEESLAAADIMQLPIVFADDEPPAPPAASAAPLALTVTSGAPRAVRYTRVIVAKKTARRRHRPPRPALDH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: