MonarchBase - Protein-coding gene

DPOGS209889
Transcript	DPOGS209889-TA	3312 bp
Protein	DPOGS209889-PA	1103 aa
Genomic position	DPSCF300049 - 435876-439187
RNAseq coverage	356x (Rank: top 33%)

Annotation
*Heliconius*	HMEL011847	0.0	83.33%
*Bombyx*	BGIBMGA000187-TA	0.0	75.88%
*Drosophila*	gry-PA	7e-155	44.05%
EBI UniRef50	UniRef50_D6WZH4	0.0	43.15%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WZH4_TRICA
NCBI RefSeq	XP_971240.2	0.0	44.14%	PREDICTED: similar to FLJ12716-like protein [Tribolium castaneum]
NCBI nr blastp	gi\|189241218	0.0	44.14%	PREDICTED: similar to FLJ12716-like protein [Tribolium castaneum]
NCBI nr blastx	gi\|189241218	0.0	43.92%	PREDICTED: similar to FLJ12716-like protein [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[267-520] IPR021773	4.5e-60	Foie gras liver health family 1
	[576-1070] IPR012880	1.5e-43	Domain of unknown function DUF1683, C-terminal
Orthology group	MCL14282		Single-copy universal gene

Nucleotide sequence:

>DPOGS209889-TA
ATGGCGACTCAGCCGAGTGACAACACAGAATTTCCGCCTGAAATCATTCTTAAGCCCCTTGCCTTGATAGGGTTGTCAGGGCTTGATACGGTGAATAATGCAATCCACAAAGCTATATGGGATGCCTTCTCAAACAACCGCCGACCGGACCGAGCCGCCGTGAGGTTCAAGTTGTTGAATAACACGTTCGAATTTCCAGTGGTGAAGCCTAAGAGAAACTCCTATGAATGGTACATCCCCAAAGGTATATTGAAGAAAAACTGGATAACTAAACGTGTATCGTTAATTCCGGCCGTGGTGGTTATTTTTTATGATATGGAGTGGAATGATCCTCAGTGGAACGAAAAGATCATCGAGTGTGCGTCGAGAGTGCAGTCGATACGGGCAGCGGTGGAGGGACACGCTACACGTGTCGCTGTTGTGGTTGTACAGAGTGGACTTTCACCCCCACCATCGGAGTACATGCTCGGTGCTGAAAGAGCACAGGCACTTTGCTCAGCATGTGAAATACAATCTAAGTCTCTCTTTGTACTCCCTCACAGCGATCACCTCATGGGTTACATTATAAGACTAGAAAATGCTTTTTATGATATTGCACAAAATTATTATCATCACGAAACCAAGAACATCAAGCAGCATAGAGATCATCTGAATAAGACTACCCATCAGTATTTGTTTGTTAGACATCAGTTCAAACTAGGCTTCCTCAATGAACTCAAGCAAGACATAAGCACGGCCCACAAACACTACATGCATGCATATAACAACCTCCTTGATACCAGACAAGTAGATACTAATGTACATGAAATACGAACCGTGTCTGGTTACATCAATTATAAACTATGTAAGCTGCTGTTTGCCTTAAATTTGCCACGAGATGCAATTGCACAAGTTAAGTCACATATAGAGCGCTACAAAAACAGAATTGGACCCACTGAACTGTTGTTTGAGCATTATGGCTGGATTGCCAGGCAGTATAGTGCCTTTGGAGAATTATTTGATGAAGCTATAAGGTTAGGGCTTCCGGCAATTCAATCCCAACATCCTGGCTTTTATTACCAGTATGCAGCTCAATTTACAGTGAAAAGACGGCAAGCCATGAGGTCGGTATGCTGTGATGCTTCACACTATCCACCTGCCCCAGACCCCATGGAGGGTATTGTGGAGTTTTATGGCCAGAGACCTTGGAGACCGGGACGACTCAGTGCGGATCCACATGATCCACAAAAGGAACAAGCGGCGGTGTTGGCACTGCAATACAATGAAAGAATTTTCAACCATTCTGCTATGATAATTAGTTTTCTAGGTAGTGCTATCTCCCAGTTTAAAACATTTCACTCGCCCAGAATGAGGAAGCAGTTAGTGGTTGAGATGGCTAATGAATATTATTTTTGTGCGGACTATGGTAAAGCTTTGACTTTATTGTCTCATATGCTCTGGGATTATAGAAAAGAAAAGTGGTGGTTTTTGGCTTCCCATGTCTTAAACCGAGCTTTACAATGTGCCTACTTGTCTGCAAAAATTCAAGACTACATTCATTTATCAGTGGAGGCACTCTCCAAATACATTCAAGTGCCAAACAACGACAAAGATAGAATATTTAGAAACATAATGGCAGTTCTCAACATGAACATTCCATCACCAGAGCCGAACCTCCCTCCTTCCTCACAGAGTAAAGCATTAGAAATGTGGCAACTGGCTATAGACAAAGAGCCTCTCACCATTGCCATAGATATGATAAACATAGCCAGTTTCCTAGAAGTAAAAGCAAAGTTCAAGCAACAGAAATATAGGATGGATGATACAATTGAAGTTGAGTTGTTTGTTAGACTTACATATAACACAACCCTTGATGTTAAAAGTGCCTCTATGACAATTGCAACAAATACAGAAACTATTGACATAAATATAACGGATGAAGGCAGTACTACACTGAAACTGATCAGAGGAGAAGTTAAAAGGTTTCTGTGTCAATTTAAAGCCAGTCCACATGATAATGGATCGGAAATGAAAATCAAAAATGTATCATTTGTATTGGACAGTGACAGGAGAAAAATTATAATGAACTTTAAAATCGATGAAATCAAGAATGTAGAGCCCACAGTCCATCCTGAATTACTACACTTCATAATGAGTCCTAAAAGTGACTATGAATTTGATTGTATAATGCCTTTGACCACTACATCCATCACCAGCAGGGAATGTAGACTGTCTTTAGATATTAAAAATGCAGTGCCGGCTTTACAAGGCGAGTGGTTTCCCACCACTTTCACAGTAATAAACCATGAAGACGGTCCCGTTCATGATATGTCAATAGTGCTGACACTTCTAAGCTCTCCTGATAATCCAAACCCTGAATCGGTCACAGAGTTGGGCTTTAGACACGGTGAACCCGAAGCCCAACCCATTAAACTCTGTGTCGGAGATGTGAATAAAAGTTCTTCATATTCAAACACATTTTATTTAAAAACTAACAGAACAGCCACAACAACTGTTCAAATAAAAGTAACGTACACAGTAGATGCTTATGAAACACCTCAACTTGAATGTTCCAAAGAATTCACAACGAAAATCACAGTGATCAAACCGTTTGATGTATCAACCAGTTTCGTGTCCATGAACTTTAAGCCTATAACGAAATGCTATGTAGATGATCCCTTTATAGTTATGCCTCAAATAAAAATTTTAAGTCCCTGGAATTTAGTTATTTTAGATACAGAACTAGAAACGGTAGAAAGCTTTAGATATGCTGATGAGAAAAAACCTCAATCATGTATAAGTAACCTACGAGTGGCTGAGAAGAATGTGGCCTCTGATGCTATATGTATACAGGCTAACTACAAGCCAAAGGAAGTCGCTACGAGAGTAGGCTTGTACAACATCTCTTGGCGTAGAGAGAGCAACACAGATGGCCATTGTGTTATGAGCACTACTGCCCTCTCGGCACTTCCAATAGATGATTGCCCAATTACTGTTGAAGTCAATTATCCAGAGGTTGTTGACCTCCAAACATCCGTGCCATTAAAATGTACTCTAATTGGGAAAACTAATACTCCTATCAGACTGAGTCTCTCCGTGGAAGGCACAGATGCATATATGTTTTCAGGGTACAAAAAGTTCTCCATCACTGTACCACCCAGAGATAAGGTCGAGTTATGTTACAACATTCACCCCCTGGTGGCCGGGAACACAATCCCTCCTCGGTTAAAAGCAACAGTTCTTGGTGACACGTCTAGACAAGAGGTTGTAAAAGAAATGTTTGACAAAATCTTTCCTCAAAATATTTTTGTTATGCCTAAATATAATAAATAA

Protein sequence:

>DPOGS209889-PA
MATQPSDNTEFPPEIILKPLALIGLSGLDTVNNAIHKAIWDAFSNNRRPDRAAVRFKLLNNTFEFPVVKPKRNSYEWYIPKGILKKNWITKRVSLIPAVVVIFYDMEWNDPQWNEKIIECASRVQSIRAAVEGHATRVAVVVVQSGLSPPPSEYMLGAERAQALCSACEIQSKSLFVLPHSDHLMGYIIRLENAFYDIAQNYYHHETKNIKQHRDHLNKTTHQYLFVRHQFKLGFLNELKQDISTAHKHYMHAYNNLLDTRQVDTNVHEIRTVSGYINYKLCKLLFALNLPRDAIAQVKSHIERYKNRIGPTELLFEHYGWIARQYSAFGELFDEAIRLGLPAIQSQHPGFYYQYAAQFTVKRRQAMRSVCCDASHYPPAPDPMEGIVEFYGQRPWRPGRLSADPHDPQKEQAAVLALQYNERIFNHSAMIISFLGSAISQFKTFHSPRMRKQLVVEMANEYYFCADYGKALTLLSHMLWDYRKEKWWFLASHVLNRALQCAYLSAKIQDYIHLSVEALSKYIQVPNNDKDRIFRNIMAVLNMNIPSPEPNLPPSSQSKALEMWQLAIDKEPLTIAIDMINIASFLEVKAKFKQQKYRMDDTIEVELFVRLTYNTTLDVKSASMTIATNTETIDINITDEGSTTLKLIRGEVKRFLCQFKASPHDNGSEMKIKNVSFVLDSDRRKIIMNFKIDEIKNVEPTVHPELLHFIMSPKSDYEFDCIMPLTTTSITSRECRLSLDIKNAVPALQGEWFPTTFTVINHEDGPVHDMSIVLTLLSSPDNPNPESVTELGFRHGEPEAQPIKLCVGDVNKSSSYSNTFYLKTNRTATTTVQIKVTYTVDAYETPQLECSKEFTTKITVIKPFDVSTSFVSMNFKPITKCYVDDPFIVMPQIKILSPWNLVILDTELETVESFRYADEKKPQSCISNLRVAEKNVASDAICIQANYKPKEVATRVGLYNISWRRESNTDGHCVMSTTALSALPIDDCPITVEVNYPEVVDLQTSVPLKCTLIGKTNTPIRLSLSVEGTDAYMFSGYKKFSITVPPRDKVELCYNIHPLVAGNTIPPRLKATVLGDTSRQEVVKEMFDKIFPQNIFVMPKYNK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: