MonarchBase - Protein-coding gene

DPOGS205681
Transcript	DPOGS205681-TA	3147 bp
Protein	DPOGS205681-PA	1048 aa
Genomic position	DPSCF300023 + 1046033-1057115
RNAseq coverage	49x (Rank: top 70%)

Annotation
*Heliconius*	HMEL007349	2e-101	67.92%
*Bombyx*	BGIBMGA001028-TA	3e-150	49.02%
*Drosophila*	CG11436-PA	7e-31	28.89%
EBI UniRef50	UniRef50_D2A0N1	3e-94	30.66%	Putative uncharacterized protein GLEAN_08239 n=2 Tax=Tribolium castaneum RepID=D2A0N1_TRICA
NCBI RefSeq	XP_002411375.1	3e-61	35.18%	conserved hypothetical protein [Ixodes scapularis]
NCBI nr blastp	gi\|270006086	1e-93	30.66%	hypothetical protein TcasGA2_TC008239 [Tribolium castaneum]
NCBI nr blastx	gi\|270006086	1e-94	30.10%	hypothetical protein TcasGA2_TC008239 [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	3e-15	binding
KEGG pathway
InterPro domain	[205-313] IPR011990	3e-15	Tetratricopeptide-like helical
Orthology group	MCL16726		Patchy

Nucleotide sequence:

>DPOGS205681-TA
ATGATGGCTGCAAGATTTATTTCATTCTTTTGTGTATTTATGATGTATTTTATCGGAACTCAAGCTTCTAATCACTGGATGGTCACTGAAAGTGGTTTAATTCAACCTAGGATTGACTCGCCTTTCAACTTGGATCGCCCTTACGATCTCTTAGCATTTTTAAATCAGGAAAAAAGATGGGATACTGTTTTTGAAATTTATAATGATCTATCAAGTAGACAAGCAATTATTGATACTCTTTGGGCTGATGTTGAAAAAGACACTAATATGGGAGTTAAAATAGCGCATAATGAACATTGTGTTAAAGCTGGTAATGTGAACGTTATAGATTGGTATGCGGCTCTGTTAGAAGATGGATCAAAGAAGATCTCTGGCAAAGAATTTCTTCTGCCTATTCCTTATTATGGCCCTAATACTGACATGCCAGATTGCAAACGAATCTCTTCATTGGCATTTAGTATGTTTGCATTTGAACATTTAGAAGGTATGTTACAACGAGACAATCTCACTGTGAATCCTGAATTTGTCCTGCCAGAGCTGATATCTCCCATCATGACCCTAGATCAATTTGGTCACTGGTTGACAACTATGCTTCAACGCAATAACTCCTCCTGGCTGTATTATCATATGGCCTCACTATATTGGCGGATTAGGGGAAACGCACCTAAAGCTATTGAGTGTAGCCGACGTGCTTTGCACTATGTACCGAGGGTGTATAAAGATATTGCTCTTGGAAGTCTTGGAATGATTTTACACAGAAGCAGCAAAACCAACGATGCTATAGTGGTTTTAAATGCAGCTATCGATCATGATCCAAATAACTATGTTAGTCATTTTGCTATTGCAAATGCCTATACAGTCATTGGAGATTTCAATACTTCTATAAAGTATTATGATAAAACACTTAAGTTAAATCCGAGGATGGAATTGGCTGCGAAACATAAGTCTGGAACGCTGTGCCATGCGAAATTAGGATTAAGAATTAAGTCAATTAGACAGACATTTAACAAGTTGCGTGAAGAATTAAAGGAATATACCAAGAAGGAAACGAAATATCTTAAAGTGCAGGCTGAGTTCCTTGGAACTATAAGACATCCTGATGATTTCGAATACAGAAACGTAGACAAAACATTCGAACGAATGGCTGAGATAACGGGTTTAAAAATGAAAGATATGAAAATGAAAATTGATAAAAATTCCCTTATAAAGTATTTTCTGGACGGTCTGATATATAACGACGACAAGTTAGCCAGAGCCGGCGTCGATGGCATCGATACGATATACAGCTTAGAGAGGCTTGTCATACACATCAATACAAATTCAAACGGTCAGAACGAACCGTTCCATGACCACCCCAGTTTCTCTATAAACATTAAGGAGAAAGTCAAACCTTCTGAACAAAAAACTGCGAAACCGGTTTCTCGAGATGACAAGAAAGAATACCATCTGGTCATTGAGAAGAAACCTACTGCGGATGAAGAATTGTCAGAATTTGAGACTGGAATTATTATGTATCCCCCAACTATAACAATAAATAGGAACATAGAGGACTTTGACAAGGAGATGGAGTGGCCATCGAATAAACTTTGCAAGGAATCAGCACATAAATTCCCAGAGAATGTTGAGGCTATATTCCCTGTCTTCTTGCCTTTCGAGAACAAAGGCATCAGACCTCAATTCACATATGAAGTGGTGGACACGGGGTTTTTGAGGCAAAAGCTATTGGAATATGTGAGCGATGGAAAGAGTGAGGACGCGGCACACATGCAGGACGCCGAAATAGGGCATAGGATATACATCGCTATGAAGAAGAAACTGGCGCCACGTTGGTTGATACTAACTCTCTCATCTTTGTACTGGAGAGTCCGAGGCCAGCCGTGGTCCGCTCTGAGTTGTCTTCGCGCCGCTGTTAAGGTGGCGAAGCCGCGCTATAAGGACCTGGTGCTGGTTTCTCTAGCCTCCGTACAGTTGGAAATAGGTCTGGCTGATGAAGCGATGACTAACGCCGAAGAGGCCTTCCGCATGAGCTTCTATGAGCCAGCTACAAATTTCCTGATTGCTGAACTGAGTATGCTCCGCAAACATCGGAACACACACATGTTCCACTTGAAGCAAGTGGTTAGAGTTGAACCAGGGTTCATGGGCGGACTTGCCAGGGAGCTTCTGCTGGCCTGGGCCTGTATACTGAAACAGGTCGTCGCTCTGAGAGAGATGGATTACGTGAAGGGCGCCATCTGTACTCAGGTTCAACCGCTCATGGACTTAGTCTGTCAAGAGGACGAAATCAACTGTAAATCGCCCAACATACAATGTTATACCAATCACGACACGAGCTCTCTCGTCCGCATGATGGACGAATCCGATACGGACTCCCTTTTCGCGATCAGTGAAAATTTCTTTGATCCGCTCATCGAGAACACTCCGGCCGATCGCGGTGAGAGATTAGCCCACCACGCCAACTTCGACAGCATGATAACAACCATTGAGTCTATATACTCCGGATGCGGGAACAAGAAATGTGCAAGTGAACTACCCACAGAAATATCATCAATACAAGTCAATAGTAAGAAGATCCCTGAATGTCGACTGCCGGCCGAGTTGGACGACTTCTACTTGGAGAAGATCGCGCGAGCTGATACAGAGGGTTGGAAACCCGTCATGACACTGATGCATCAGTTCTCGGAAATGTTTGACTCATATGACTTCAATACGTTGGGCTCGAAGATCGCGAAGTATGTGGATATGCGTCCTCGTTGGTGGGCGGGTCTGGTGGCGGCCGGCTGGTGGTGTGGTGCCGGTGGGCGCGGGTCGTGCGCCGCTCGCTGCCTCGCCGCCGCTCACAGATACGCTCCAAACAAATACGCTACTTACCCACTAAGATCCCTGGTCGCCATGTTACATATGCAATCAAAACAACAGGACGCCAAACAGATCGCCTACCTGTCTTTCTACATGTCACCCAAGAATAAAATAGAGGCTTTCCTTGTAGCCGTATCACACGCGTATCTGGCCGAGTACGAGCAAGCTATGTGGATGTATCGTTATGCTCTCACTTTCGACGCCGACTTCGTTCCGGCCAAAGCGAGCATACATTCAACGATATGCCTCCTTTTATATCGTGACGGGAAAGCACAATTTATGGAATAA

Protein sequence:

>DPOGS205681-PA
MMAARFISFFCVFMMYFIGTQASNHWMVTESGLIQPRIDSPFNLDRPYDLLAFLNQEKRWDTVFEIYNDLSSRQAIIDTLWADVEKDTNMGVKIAHNEHCVKAGNVNVIDWYAALLEDGSKKISGKEFLLPIPYYGPNTDMPDCKRISSLAFSMFAFEHLEGMLQRDNLTVNPEFVLPELISPIMTLDQFGHWLTTMLQRNNSSWLYYHMASLYWRIRGNAPKAIECSRRALHYVPRVYKDIALGSLGMILHRSSKTNDAIVVLNAAIDHDPNNYVSHFAIANAYTVIGDFNTSIKYYDKTLKLNPRMELAAKHKSGTLCHAKLGLRIKSIRQTFNKLREELKEYTKKETKYLKVQAEFLGTIRHPDDFEYRNVDKTFERMAEITGLKMKDMKMKIDKNSLIKYFLDGLIYNDDKLARAGVDGIDTIYSLERLVIHINTNSNGQNEPFHDHPSFSINIKEKVKPSEQKTAKPVSRDDKKEYHLVIEKKPTADEELSEFETGIIMYPPTITINRNIEDFDKEMEWPSNKLCKESAHKFPENVEAIFPVFLPFENKGIRPQFTYEVVDTGFLRQKLLEYVSDGKSEDAAHMQDAEIGHRIYIAMKKKLAPRWLILTLSSLYWRVRGQPWSALSCLRAAVKVAKPRYKDLVLVSLASVQLEIGLADEAMTNAEEAFRMSFYEPATNFLIAELSMLRKHRNTHMFHLKQVVRVEPGFMGGLARELLLAWACILKQVVALREMDYVKGAICTQVQPLMDLVCQEDEINCKSPNIQCYTNHDTSSLVRMMDESDTDSLFAISENFFDPLIENTPADRGERLAHHANFDSMITTIESIYSGCGNKKCASELPTEISSIQVNSKKIPECRLPAELDDFYLEKIARADTEGWKPVMTLMHQFSEMFDSYDFNTLGSKIAKYVDMRPRWWAGLVAAGWWCGAGGRGSCAARCLAAAHRYAPNKYATYPLRSLVAMLHMQSKQQDAKQIAYLSFYMSPKNKIEAFLVAVSHAYLAEYEQAMWMYRYALTFDADFVPAKASIHSTICLLLYRDGKAQFME-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: