MonarchBase - Protein-coding gene

DPOGS208213
Transcript	DPOGS208213-TA	1569 bp
Protein	DPOGS208213-PA	522 aa
Genomic position	DPSCF300179 + 255298-258306
RNAseq coverage	572x (Rank: top 22%)

Annotation
*Heliconius*	HMEL003231	7e-114	78.19%
*Bombyx*	BGIBMGA002260-TA	1e-146	54.64%
*Drosophila*	CG9986-PA	7e-91	37.58%
EBI UniRef50	UniRef50_E2BIG5	7e-124	44.67%	Uncharacterized protein C12orf4-like protein n=8 Tax=Formicidae RepID=E2BIG5_HARSA
NCBI RefSeq	XP_394347.3	7e-122	43.04%	PREDICTED: similar to Protein C12orf4 [Apis mellifera]
NCBI nr blastp	gi\|307206527	2e-123	44.67%	Uncharacterized protein C12orf4-like protein [Harpegnathos saltator]
NCBI nr blastx	gi\|307206527	2e-118	44.20%	Uncharacterized protein C12orf4-like protein [Harpegnathos saltator]

Group
KEGG pathway
InterPro domain	[42-507] IPR019311	6.5e-113	Protein of unknown function DUF2362
Orthology group	MCL11781		Single-copy universal gene

Nucleotide sequence:

>DPOGS208213-TA
ATGACCGCTACGGAGTTAGAGAATGCTACAAAGACTTTTAAATTTTCTTTTCCAACATGCACGAACGAAGATCTGTTATTCAAATTAGAAGTGCCTGTGGAGATACCTTACCCAGGCTCCACGAGAGAGCTGGTGCAAAGAATATTAAAAATGTTCCACATTCCAGTATATTTGGAAGACGAGCTTAATGAGAAATTGGCTGATTTTGTATCAGAAGAAACAAGAAACTTTCACCACAATCGTGATGCTACACTGATTGACCAATTGAAGAACAATGAATTAGATTTGGAAGGTATTATCAAGAATTGGGAAAAGCAATTTAAAAATGTAGTTGACTTTGCTGAACAGAAGGGATCTTCCGACGAGGAGGTATTTGCTGCTGCTTACCACAAGCTGGTGCACTCCCCGGCTCTGGAGACTATACTACAAGTAGAGAGCGCTTATGCGAAGACTGTCATGGACATGATTCAGAACAGGGATGACGACATCAGGAAGCTTACAAAGAGGCAAACAGAAGAAATGGAAGAGAAAATCCGCCTTCTGAACACTTCCACTACAGAAGAGGAAATCAATACATTAGCAGCTAAGCATTTTGAAGCTCAGAGCCTTGCAACAGGTCGGTGGGACTCACAGCTGGATGCCTTGAAACACACACAGAGAGCAGAGCACCGCACCTGGCTCATGAATGCTATCAATGAATATCAGACTGAGGAGAAAATTACTCCCAGCAACTCTCCCCTGTGTTCGTACGCGTCGCTGCCACCCGCGCCGGCCGCTCCCGCCACCCTGCTGGAGGAGAGCTTCACCATACACCTCGGCTCTCAACTCAAACAAACACACAACATCAGGCTCGTATGCGCAGACATGTTAGACCTGTGCGCGCGAGACAGGACCGACGGTGGCCTGTCCCTGAGTCTATACTCGAGCGAGTTGTCGGGGGCGGTGGTGGTGTGCGAGGGTCGGCCGTCCCGCTCACCCTTGACCAGTCTGCCGCGAGTCACCGACCATCACTTCCCCGACTTGCACGACCAGCTGAGACGAATAGAGGAGGCGGTCGCCGACCCGGCGGAGACACGCAACAGAAGCCGCGGCGAGCGCGAGTCGCGGCGGCGGGCGCTGCGAGCGGGGGACGTGTTCGTGACGAGGCACAGCAACCTGTCCCAGCATGTGGTGTTCCACCTGGTGGCGGACGAGGACGAGCTGCGCTCGGCCGAGCTGAGCTCGCGGCACCGCGCCGTGCTGGGGCTGCGCGAGGTGCTGCTCGCGGCGCAGCGGAACGACGTAGCCAGCGTGGCGCTGCCGCTGCTACTGCGGCGCGAGCTGGGCGAGGATGCCACGGCTGCCTGGTGCCTGCGTCGCGCCGAGCTCGTGCTCAAATGCGTCAAGGGGTTCGTGCTGGAGGCGAGCGCGGCGGGCGGCGCGCGCCTTAAGACGCTTACGGCCGCCGTACCGCGGGAGGCGCGCGCTCTGTTCCCCGCCCTGGCCGCACTGCTGCCCGCAGTGTTCCGCGTCGCCGGGCCGCTCCGGCCGAGACTACCCTCGCACGAAGCGCCACGGCCGAGAGTCTAG

Protein sequence:

>DPOGS208213-PA
MTATELENATKTFKFSFPTCTNEDLLFKLEVPVEIPYPGSTRELVQRILKMFHIPVYLEDELNEKLADFVSEETRNFHHNRDATLIDQLKNNELDLEGIIKNWEKQFKNVVDFAEQKGSSDEEVFAAAYHKLVHSPALETILQVESAYAKTVMDMIQNRDDDIRKLTKRQTEEMEEKIRLLNTSTTEEEINTLAAKHFEAQSLATGRWDSQLDALKHTQRAEHRTWLMNAINEYQTEEKITPSNSPLCSYASLPPAPAAPATLLEESFTIHLGSQLKQTHNIRLVCADMLDLCARDRTDGGLSLSLYSSELSGAVVVCEGRPSRSPLTSLPRVTDHHFPDLHDQLRRIEEAVADPAETRNRSRGERESRRRALRAGDVFVTRHSNLSQHVVFHLVADEDELRSAELSSRHRAVLGLREVLLAAQRNDVASVALPLLLRRELGEDATAAWCLRRAELVLKCVKGFVLEASAAGGARLKTLTAAVPREARALFPALAALLPAVFRVAGPLRPRLPSHEAPRPRV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: