MonarchBase - Protein-coding gene

DPOGS204326
Transcript	DPOGS204326-TA	3414 bp
Protein	DPOGS204326-PA	1137 aa
Genomic position	DPSCF300142 - 127249-137838
RNAseq coverage	93x (Rank: top 62%)

Annotation
*Heliconius*	HMEL002323	3e-131	53.52%
*Bombyx*	BGIBMGA000001-TA	1e-124	55.78%
*Drosophila*	phtf-PA	2e-101	42.22%
EBI UniRef50	UniRef50_Q16RV6	3e-104	43.52%	Putative uncharacterized protein n=2 Tax=Culicinae RepID=Q16RV6_AEDAE
NCBI RefSeq	XP_001661074.1	5e-105	43.52%	hypothetical protein AaeL_AAEL010838 [Aedes aegypti]
NCBI nr blastp	gi\|307193677	1e-104	37.85%	Putative homeodomain transcription factor [Harpegnathos saltator]
NCBI nr blastx	gi\|157127528	2e-112	38.35%	hypothetical protein AaeL_AAEL010838 [Aedes aegypti]

Group
KEGG pathway
Orthology group	MCL10846		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204326-TA
ATGGTGGAACAGCTCCTGATGAGAGGAACATACAGACGTCGGATCATAGACTTCACATCCCATCCAAGATCATATCTGATAGATGTTGATCTAGTCAGAGGCAAGTTGAAAAACATTATAACCGCTTCAATGTCCTATTCATGGATAGTGCCTCTTGGTCTTATGATAGTCCTAAGTATAGTGCATTCTCAAATAGTCAGCACTACTGAAATGGAACTCGCCAGAGTAAGACCTCGTTCAGCATATCGGAGGAAACTACCTAGAAAAACCCGATCAGACTGCGATGGCGGTAGTGGCGGTGGATCTGCTGAAAGTGGTGCAACTTCAAGCCACAGCAAAACTCCTCTCACAAAATCATCAAAATTCAGGCGAAGGCTCTCGAGATCTGATTCAACTGATACAGGGATGCGGAAACGTAAAAAGGAAGTGACCAAAAATAATGACACTGTATTACATGCGTGCAAAGAAAAAAATACTGCGAAAGCAAAAGTTAAAGATTCAGACGACGAGGATTATATGTCCTGGAAAAAACCAGAAGAAACAGCGCCAGTGGTGACGTTCACTCCACCAGCTGACGAGGGGAACACCAAACGTACGTTCCGATACAAACCGAACATATTGACAAAGAAATACTTAGAATTCTTCAATGTACGCCAGAATTTAAATAGACCTATCTTCGCTGACGGTGACGACGGTTTTGAGAGTCTCAACGGCTACAACTCCCACGGCAGCGACGGAGAAATCAGGAACAGAGACACGGATAGGAAGCCACGCGAGCAAATAAAAGAAAAGCCGGCAGAGGAAAACGATCCAAAAATAATAGCGTCGGAAGAAAAAGCAGAAAGCGCGAAAACAAGCAAAGATGAAGAAGACAAATTTGTGGACCATGAATCAGATAGCGCCACAACGAATCACGGCAAAAGGGTCGGCGTGAGATTCAGGAAATCTTGGGCCAAAAACTCCGTCCACGAATCAACGGACGAAGATTACAATCTTAAAGCCAAACAAAAGAAACTAAATAACTACCAGAGTTCGTCATCGGACGGTGAGTGTTCGGCTTCAGCGCCATCTATCGCTTTACCGTCACACCATACTATGTCAGACTGGGTTGGCCAAATTACTAACAGTGAAGAGAGCAGTTACGGATCCCAATCCGAAGCCGGTCACTCCGATGTGTTTCATTACACAGCCGACAGCTCTTGGGATCCGTTCGCTATTTTGGATCCTTCCAGCGACACTGATTTCATAGCCCCGGTGTCTTTGGACATTGATTCCTATTCATGGATAGTGCCTCTTGGTCTTATGATAGTCCTAAGTATAGTGCATTCTCAAATAGTCAGCACTACTGAAATGGAACTCGCCAGAGTAAGACCTCGTTCAGCATATCGGAGGAAACTACCTAGAAAAACCCGATCAGACTGCGATGGCGGTAGTGGCGGTGGATCTGCTGAAAGTGGTGCAACTTCAAGCCACAGCAAAACTCCTCTCACAAAATCATCAAAATTCAGGCGAAGGCTCTCGAGATCTGATTCAACTGATACAGGGATGCGGAAACGTAAAAAGGAAGTGACCAAAAATAATGACACTGTATTACATGCGTGCAAAGAAAAAAATCCTGCGAAAGCAAAAGTTAAAGATTCAGACGACGAGGATTATATGTCCTGGAAAAAACCAGAAGAAACAGCCCCAGTGGTGACCTTCACTCCACCAGCTGACGAGGGGAACACCAAACGTACGTTTCGATACAAACCGAACATATTGACAAAGAAATACTTAGAATTCTTCAATGTACGTCAGAGTTTAAATAGACCTATCTTCGCTGACGGTGACGACGGTTTTGAGAGTCTCAACGGCTACAACTCCCACGGCAGCGACGGAGAAATAAGGAACAGAGACACGGATAGGAAGCCACGCGAGCAAATAAAAGAAAAGCCGGCAGAGGAAAACGATCCAAAAATAATAGCGTCGGAAGAAAAAGCAGAAAGCGCGAAAACAAGCAAAGATGAAGAAGACAAATTCGTGGACCATGAATCAGATAGCGCCACAACGAATCACGGCAAAAGGGTCGGCGTGAGATTCAGGAAATCTTGGGCCAAAAACTCCGTCCACGAATCAACGGACGAAGATTACAATCTTAAAGCCAAACAAAAGAAACTAAATAACTACCAGAGTTCGTCATCGGACGGTGAGTGTTCGGCTTCAGCGCCATCTATCGCTTTACCGTCACACCATACTATGTCAGACTGGGTTGGCCAAATTACTAACAGTGAAGAGAGCAGTTACGGATCCCAATCCGAAGCCGGTCACTCCGATGTGTTTCATTACACAGCCGACAGCTCTTGGGATCCGTTCGCTATTTTGGATCCTTCCAGCGACACTGTGAAATGTACAATGTGGGAGCGTGGTTGTACTCTGCGCGCTGAATTGTCAGCTGTTGATATAAGTTGGTACGTGGTGGCTCGGGCGGAGCGCGCTATGTCCGACGGCGGGGTCTGGCCGGGGCTGTTCATGGCGAGCCTAGTGGCTGTAGTGTCACCCTTTATGAGACTTGTACAGGTGGCTATAGAGAAGGACACGCGCAGTGAAGATGAGCTGCAGAACATTTCTCTCATCAGCTACATTCCATCTCTTGTGGTGAACTATACCCAGGGCTCGATGGTTTGCGTTTTCAACGGAGCTCTCGGAGACAGCTTTTGGGAGATATCCTCGAACGTACTATCATGTGTATTACGTTTCGCTCTAAGCGCTCTAGTGTTCTTCCTCCTGGCGGTCGCTGAGCGCGCCTACAAACAGAGATTCCTTTACGCAAAGCTTTTCTCGCATCTAACGTCGGCGAGGCGAGCAAGGAAATCAGAATTGCCGCATTTTAGATTAAATACAGTCAGAAATATAAAGACGTGGCTGTCAACTAGATCATATCTGCGGCGTCGTGGACCGCAGAGGTCGGTTGATGTGATAGTATCGGCTGCTTTTATGTTGACCCTCACATTACTTGCTTGTGTCAGCGCACAACTATTAAGGGACTCGGTTACTCTTGAGAGGGGCTGGTTGTTAGAAGCTATGGTTTGGAGCTGTTGCCTCGGTATATATCTCCTTCGTCTGCTCACCCTCGGCAGTAACGTGAACAGGAAGTACCGCGGATGTCTCTCAGCGATACTCACAGAACAGATCAACTTACATCTGGCGATAGAACAGCGACCCGAGAGCAAAGAACAACTCACCGTAGCCAACAATGTCCTTAAATTGGCCGCAGATTTGCTAAAGGAATTGGATTCGCCGTTTAAGATATCAGGGATATGTGCAAATCATTATCTCTACACCATAACTAAAGTCGTGATACTCTCCGCGCTGTCTGGAGTCTTATCTGAAATGTTAGGATTTAAGTTGAAATTGCACAAAATTAAAATTAAATAA

Protein sequence:

>DPOGS204326-PA
MVEQLLMRGTYRRRIIDFTSHPRSYLIDVDLVRGKLKNIITASMSYSWIVPLGLMIVLSIVHSQIVSTTEMELARVRPRSAYRRKLPRKTRSDCDGGSGGGSAESGATSSHSKTPLTKSSKFRRRLSRSDSTDTGMRKRKKEVTKNNDTVLHACKEKNTAKAKVKDSDDEDYMSWKKPEETAPVVTFTPPADEGNTKRTFRYKPNILTKKYLEFFNVRQNLNRPIFADGDDGFESLNGYNSHGSDGEIRNRDTDRKPREQIKEKPAEENDPKIIASEEKAESAKTSKDEEDKFVDHESDSATTNHGKRVGVRFRKSWAKNSVHESTDEDYNLKAKQKKLNNYQSSSSDGECSASAPSIALPSHHTMSDWVGQITNSEESSYGSQSEAGHSDVFHYTADSSWDPFAILDPSSDTDFIAPVSLDIDSYSWIVPLGLMIVLSIVHSQIVSTTEMELARVRPRSAYRRKLPRKTRSDCDGGSGGGSAESGATSSHSKTPLTKSSKFRRRLSRSDSTDTGMRKRKKEVTKNNDTVLHACKEKNPAKAKVKDSDDEDYMSWKKPEETAPVVTFTPPADEGNTKRTFRYKPNILTKKYLEFFNVRQSLNRPIFADGDDGFESLNGYNSHGSDGEIRNRDTDRKPREQIKEKPAEENDPKIIASEEKAESAKTSKDEEDKFVDHESDSATTNHGKRVGVRFRKSWAKNSVHESTDEDYNLKAKQKKLNNYQSSSSDGECSASAPSIALPSHHTMSDWVGQITNSEESSYGSQSEAGHSDVFHYTADSSWDPFAILDPSSDTVKCTMWERGCTLRAELSAVDISWYVVARAERAMSDGGVWPGLFMASLVAVVSPFMRLVQVAIEKDTRSEDELQNISLISYIPSLVVNYTQGSMVCVFNGALGDSFWEISSNVLSCVLRFALSALVFFLLAVAERAYKQRFLYAKLFSHLTSARRARKSELPHFRLNTVRNIKTWLSTRSYLRRRGPQRSVDVIVSAAFMLTLTLLACVSAQLLRDSVTLERGWLLEAMVWSCCLGIYLLRLLTLGSNVNRKYRGCLSAILTEQINLHLAIEQRPESKEQLTVANNVLKLAADLLKELDSPFKISGICANHYLYTITKVVILSALSGVLSEMLGFKLKLHKIKIK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: