MonarchBase - Protein-coding gene

DPOGS211122
Transcript	DPOGS211122-TA	2733 bp
Protein	DPOGS211122-PA	910 aa
Genomic position	DPSCF300007 - 428907-433188
RNAseq coverage	124x (Rank: top 57%)

Annotation
*Heliconius*	HMEL012419	0.0	53.43%
*Bombyx*	BGIBMGA002998-TA	3e-80	57.83%
*Drosophila*	Tango6-PA	8e-22	28.69%
EBI UniRef50	UniRef50_E2A103	4e-82	29.82%	Transmembrane and coiled-coil domain-containing protein 7 n=8 Tax=Formicidae RepID=E2A103_CAMFO
NCBI RefSeq	XP_001814851.1	3e-76	27.85%	PREDICTED: similar to rCG51257 [Tribolium castaneum]
NCBI nr blastp	gi\|383850285	5e-93	31.57%	PREDICTED: uncharacterized protein LOC100882243 [Megachile rotundata]
NCBI nr blastx	gi\|383850285	5e-98	31.57%	PREDICTED: uncharacterized protein LOC100882243 [Megachile rotundata]

Group
Gene Ontology	GO:0005488	1.1e-17	binding
KEGG pathway	mbr:MONBRDRAFT_25105	2e-18
	K01763 (SCLY)	maps->	Selenoamino acid metabolism
InterPro domain	[288-887] IPR016024	1.1e-17	Armadillo-type fold
	[638-881] IPR011989	1.6e-07	Armadillo-like helical
Orthology group	MCL17517		Patchy

Nucleotide sequence:

>DPOGS211122-TA
ATGTCCGACGTTAATTGTATATTTAAGCAAATAGAAAAGATTCTGAAAATTGACACAAACACCGAGTTCATGGTTGCGGTTTTCAATGAAATCATCAAGTGTAATAGCAGCTTGAACGAAAATGATATATTTGACGTTTTAAGGACATTTCTAAACAACATAATCAAAGAAATCGATGAACTTGGTACTATCATCAAAAACAACGATGGTGTCAGTATCAGTGTCAAAAATCAAAAAATGTTGCGTACCTGTTATCAAATAATTACCTCGTTTGGTATATCATCATGTTTATTGCCTGGTTTAGGAATCAGCCTGTCTAAGAGGTGTGCCACTGCGAAGTCACTGCCAACATTATCACTTAAAGATACAGAGAAATATGAACTACTAGTTTGGTGTACAGATTTCTTGTCCAGAAGTTATGAAGTACCAGTACTTAAAAATATTATATTAACTTTTCATTTGTCCGATTATCTGGCAGCACTTATACAATTAGCCTTTGCCCCTTTGAAGAAACCTGGAGATTATTCAAATTTCACTATGACTCAAGAGATGTACGACAAGTTATTGTTTGATAAGCAGAAATATATAAAAACTTATGAGTACTTAGTGAATAATTGCTTCCAGCCAATGTTAATGAAGGAACTTTTAGTATTACAGAATATAACAGAGCACCCACCTCCAATGTTTGCTAAGAAAGTTATTTCAAAGGAAATGAGTAAGCGTCTCACAACTTGGGGTGGGTTACTCAGCCTGATTAGATGTTTCATCGAAAGCCACGAGGTCGACGTCGGTGTCGAGTGGAAGAAAATAGAAATGATCTGTAAAATAGTTACTTGTCGGCACTTGAACTTGAGTGAAGAGGACTATTTGAGTAACATTGTCTCGCAGTTAAGGCATATATACACTATGAATAATAAACATTACTTGATAACAGCATCTTCGTGCTTGTTAAGCCTATATACAAAATACAATAAATCCACATCAGTGATAAATTTGCTCAATGAAGTCTTTGGTAGTTTTGATCATGAAGCCTTATTGGCCGATGCTTTACCGGGAACTATTATATTGGTGTCACAGCAAGTCCAACACAACATACAGATCCTTCAGGCATGTACAGCTATAACGCAATATGAGCTACCAATACAAATGTCCAAGAACTTGTATGTGCTGTATCTCTTAAGGCTCAACTGTACAAAAACTGAAATGAAGCTCAAATTAAATGACATTATACTCAAAATTATGGAGTTGTTAAATAAAAGTGAGATAAAAATTGTAATTGAACAAATTCTTTTTGGACTGAACAATCACAATTCTCATAAAATCATAGCTAAAGAATACGAGTCCGGTCTTTCAGTGAAATGTGTAACAGCGGACTTTGAATATCCCAGCGACGAGGCAGTTATATATTTTATAGAAATGTTTAATTTAATAACGAACAATGATGTCGTTTGTAACATATTCGAAGCGTGCTTATTAAAATTTATTGAATTGAATAAAGAAAACGAAACATGCGATAAAGAGGCTTTTCTGTTGGTCGAAGATGAGCCTGAGGTGCTTAACTCGGTTAGCAAAAAGTGTGCTCATATGCTTCATATCCTATCCGAAATATCAGCAACCGAGAAGGTTATAACCATTTTGAAAGACAAACCACTTCTTGTGCTAGATTTCGTTGAATCATTATTACTAAATAATATAAACCCAATAAATGATGAGTGTTGTACTATTGCTCTTGTTCTTCTCAATACTATTGTAGCTAACATTGAGAAAACCGAGGACATACAAACAAGACTTAATGGCCTGATGCCGAGACTGAAACAATTGTCAGGGGAAAATTCTTCGTATGTAAATGTTTTGTCCAAGGAAACGTTGTCTTTGATCGAAATGGAATGTCCAAAAGCTGATAAAAGTGCTTACGAAAAAGCAGTGTCCAATATTTATGACAAGTTACTGCCAGTGCGAGTTCATGGGGTCATTGAACTCACTAAACTAATCGACAGATCAGATGTGGAGACCATTTCTAAGAGACATTTCATATTTTGTCTCTTCCAGGAACAACTCAGACATCCCGATTCCTATATGTATCTAGCATCAGTGAACGGTATAGCCTCGCTAGCTATGCACTGCACCGCTGAAGCGTTGTCTATACTTTGTAGAGAATATTTAGAAGTTTCTCCGGATATCAGAAATAATGAGAGTGAAAACCAAAACGCAGAACTCAGAATGAAAATAGGAGATGTTATAGTTAAAGTTACGAGGAGACTAGGCGAAATGGCGGTAGTTCATAAAACGATTTTACTTAACACGATGCTGTGCGCCTGCAAGGATGATGACCCGCTGATAAGAACGTCGGCTCTATCGAATCTAGCAGAAATAGCATTGGTTTTGAATTACAAAATCGGTTCTATTTTATACGAATTATTGCTATGTGTTTGGGACGTTATAAATGGGGATCCGGCGTTGGAATGTCGGAGAGCAGCTGTGATGGTTTTGGCCAACCTAATCAAGGGTCTTGGCAAAGATACCTTAGTAGAACTAAACGATACTCTACTACCCATCTATAAGACTCTCCTCAAACTCTACAAAGATGATGACGAGGATTCGTTAGTTAGGCTCCACTCGCAAATCGCTCTAGAGGAACTAAATGACATCGTCAAAGGATTCCTCACACAATGTCTTCCGTACGAAAAAGAAATTTCACTAACAACGACCCCCAATAATATAATTTTCAAATAA

Protein sequence:

>DPOGS211122-PA
MSDVNCIFKQIEKILKIDTNTEFMVAVFNEIIKCNSSLNENDIFDVLRTFLNNIIKEIDELGTIIKNNDGVSISVKNQKMLRTCYQIITSFGISSCLLPGLGISLSKRCATAKSLPTLSLKDTEKYELLVWCTDFLSRSYEVPVLKNIILTFHLSDYLAALIQLAFAPLKKPGDYSNFTMTQEMYDKLLFDKQKYIKTYEYLVNNCFQPMLMKELLVLQNITEHPPPMFAKKVISKEMSKRLTTWGGLLSLIRCFIESHEVDVGVEWKKIEMICKIVTCRHLNLSEEDYLSNIVSQLRHIYTMNNKHYLITASSCLLSLYTKYNKSTSVINLLNEVFGSFDHEALLADALPGTIILVSQQVQHNIQILQACTAITQYELPIQMSKNLYVLYLLRLNCTKTEMKLKLNDIILKIMELLNKSEIKIVIEQILFGLNNHNSHKIIAKEYESGLSVKCVTADFEYPSDEAVIYFIEMFNLITNNDVVCNIFEACLLKFIELNKENETCDKEAFLLVEDEPEVLNSVSKKCAHMLHILSEISATEKVITILKDKPLLVLDFVESLLLNNINPINDECCTIALVLLNTIVANIEKTEDIQTRLNGLMPRLKQLSGENSSYVNVLSKETLSLIEMECPKADKSAYEKAVSNIYDKLLPVRVHGVIELTKLIDRSDVETISKRHFIFCLFQEQLRHPDSYMYLASVNGIASLAMHCTAEALSILCREYLEVSPDIRNNESENQNAELRMKIGDVIVKVTRRLGEMAVVHKTILLNTMLCACKDDDPLIRTSALSNLAEIALVLNYKIGSILYELLLCVWDVINGDPALECRRAAVMVLANLIKGLGKDTLVELNDTLLPIYKTLLKLYKDDDEDSLVRLHSQIALEELNDIVKGFLTQCLPYEKEISLTTTPNNIIFK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: