MonarchBase - Protein-coding gene

DPOGS206000
Transcript	DPOGS206000-TA	1425 bp
Protein	DPOGS206000-PA	474 aa
Genomic position	DPSCF300253 - 177730-182319
RNAseq coverage	213x (Rank: top 46%)

Annotation
*Heliconius*	HMEL014617	0.0	76.99%
*Bombyx*	BGIBMGA012658-TA	2e-174	76.36%
*Drosophila*	CG13567-PA	7e-57	55.84%
EBI UniRef50	UniRef50_Q9UKZ1	3e-89	42.04%	UPF0760 protein C2orf29 n=59 Tax=Coelomata RepID=CB029_HUMAN
NCBI RefSeq	XP_624811.2	1e-91	45.38%	PREDICTED: similar to CG13567-PB, isoform B [Apis mellifera]
NCBI nr blastp	gi\|332374674	1e-94	44.42%	unknown [Dendroctonus ponderosae]
NCBI nr blastx	gi\|332374674	1e-90	44.19%	unknown [Dendroctonus ponderosae]

Group
KEGG pathway
InterPro domain	[293-466] IPR019312	1.1e-119	Protein of unknown function DUF2363
Orthology group	MCL13108		Single-copy universal gene

Nucleotide sequence:

>DPOGS206000-TA
ATGTCTCAACAGCTAATAAATGAAAATAGCAAATATGTTTTAGACTTATTTTCAGAGCAGACTATCGACTCCCAAAGTCTAGAATCCATCTGTGCTCAAGTCCAGAAGAGATTCCCAAAGTCTGAACATTTTAATTTGTGTCTTCTTTTCTCCACTCTCATCGCCGGAGGTGATCTGACATTACCGGGTCAAAGAGTAGTGGCGCTGGCTCTTATACATGACTTCTATAAAGGAGACAATCCGTTCAGTTCATTATATTTACATCTCCTGGACGGCAAGCCGGGACTCATTGCGTTGGCTCCTCAGGAAAGGCTGTTCATAGGACAATTACATGGCTTTGTGCTTGGTAATATTAAAGATGTGTTCAAGAAGACGGCGAAGCAGGTCATGTTGACGGAGGTGTCCGCTAAGGAACTGGAGTTTGATTACTCATCTCTACAGGTGCTGATGACGGAGCGCTCGTCGGACATCAGTTCCATTGCGAAGGCGACTGCACCAGCGTTAGTTCCGCTCGGTGATGGGGCGCCTCCGAGCCGTATGTCTATGAAGGAGTTGTTGGAAGCGTTGATGAGTAACGAGTATCTGCCTTTGCACCGCACCCTGTCGCCGGCGGGGCCGGTCCCTCCCCCCGCCTTCATCATGGACCCCACTGAGATCGCCTTTGCCGGGGAGGCAGTGTGGAAGAACCTCGTGAACCGGGGGGCGTATATTCCCTTGTACGACACCGACATGGAAGGTTTAACAGGACTTCGCCCCGAAAAGCGTGTGACACCCACCACAGAAAGTGCACCCAAGGAAACCAAAGAGAAGTCAGCAGAGAAAACGGAAGAAGTGACAGAAGAGAAGAAAACCGAAGAGAATCCCGTCGAAGAAGCAAAGGAACTGACGGCCATCGCTCTGAAGACGGCCTTGAGTGTTTCTCAACAACAGAGACTGTTGGCGCTACTGGACGACACGCCGGACATCGTGTACGAAATAGGAGTCACGCCCAACCAGCTGCCGGATTTAGTGGAGAACAACCCCATGGTGGCGATATCGGTGCTGCTGAAGCTGATTCACTCCCAGCACATCACGGACTACTTCTCCGTGCTCGTCAACATGGAGATGTCTCTGCATTCAATGGAAGTTGTCAACAGGTTAACGACCTCAGTGGATCTCCCCGTGGAGTTCGTTCACCTCTACATCAGTAACTGCATCTCAACCTGTGAGACGATCAGGGACCGCTACATGCAGAACAGGCTGGTGCGACTGGTGTGCGTGTTCCTCCAATCACTCATAAGGAACAAGATCATTAATGTTAAGGAACTATTCATAGAGGTGGAAGCATTCTGCGTCGAGTTCAGCAGAATACGAGAAGCAGCGGCGTTGTTCAGACTCCTCAAGCAATTGGACTCTGGAGACGCTCACAAGGATGGAAAGGATTAG

Protein sequence:

>DPOGS206000-PA
MSQQLINENSKYVLDLFSEQTIDSQSLESICAQVQKRFPKSEHFNLCLLFSTLIAGGDLTLPGQRVVALALIHDFYKGDNPFSSLYLHLLDGKPGLIALAPQERLFIGQLHGFVLGNIKDVFKKTAKQVMLTEVSAKELEFDYSSLQVLMTERSSDISSIAKATAPALVPLGDGAPPSRMSMKELLEALMSNEYLPLHRTLSPAGPVPPPAFIMDPTEIAFAGEAVWKNLVNRGAYIPLYDTDMEGLTGLRPEKRVTPTTESAPKETKEKSAEKTEEVTEEKKTEENPVEEAKELTAIALKTALSVSQQQRLLALLDDTPDIVYEIGVTPNQLPDLVENNPMVAISVLLKLIHSQHITDYFSVLVNMEMSLHSMEVVNRLTTSVDLPVEFVHLYISNCISTCETIRDRYMQNRLVRLVCVFLQSLIRNKIINVKELFIEVEAFCVEFSRIREAAALFRLLKQLDSGDAHKDGKD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: