MonarchBase - Protein-coding gene

DPOGS208637
Transcript	DPOGS208637-TA	3648 bp
Protein	DPOGS208637-PA	1215 aa
Genomic position	DPSCF300281 - 280047-289534
RNAseq coverage	118x (Rank: top 58%)

Annotation
*Heliconius*	HMEL011738	0.0	57.34%
*Bombyx*	BGIBMGA007771-TA	3e-92	64.59%
*Drosophila*	CG5038-PA	8e-124	38.10%
EBI UniRef50	UniRef50_D6WKI5	6e-174	45.86%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WKI5_TRICA
NCBI RefSeq	XP_973495.2	4e-174	45.82%	PREDICTED: similar to transmembrane and tetratricopeptide repeat containing 4 [Tribolium castaneum]
NCBI nr blastp	gi\|270007554	2e-173	45.86%	hypothetical protein TcasGA2_TC014151 [Tribolium castaneum]
NCBI nr blastx	gi\|270007554	3e-174	45.86%	hypothetical protein TcasGA2_TC014151 [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	2.3e-55	binding
	GO:0005515	4e-09	protein binding
KEGG pathway
InterPro domain	[927-1184] IPR011990	2.3e-55	Tetratricopeptide-like helical
	[749-825] IPR013618	1.5e-28	Domain of unknown function DUF1736
	[1044-1077] IPR001440	4e-09	Tetratricopeptide TPR-1
	[1044-1077] IPR019734	9.9e-09	Tetratricopeptide repeat
Orthology group	MCL14901		Single-copy universal gene

Nucleotide sequence:

>DPOGS208637-TA
ATGCCCACAGTTATTTTATTGGATGTTTCTCTTTCAATGTCTAGGCCTTTACCTAACAGTGATTCTACTGAGACTCATACTCGATTTACATTAGCGACCGCTGCTATAAACACATTTTTGGACTATTTATGTGTCCATGCTAAACTGGAATATGTAGCGTTAGTAACATTTTCATCATTATGTGAAGTTTCAGTTCCCTTTACTCGAGAATTTGACAATATTCGCGTTAAATTGCCTACGTTAGAAGAAGGTGACAAAACATGCATAGAAACTGCTCTTCATGGAGTTAACCAGCTGGTTTTAAATGAGTGGGGTTATCAGACAGCAGTTCAAATAATACTGATCACTGATGGTAGCTGTGGTGTGGGTTCTATTGGGAGGAATAGGATTATTAAAGCATTGCCACTGCCCCCAACTTACCCTGGCAAAATTCATACGATAAATTTAATTATCTCTCATTCATCTATGCCACTTTATCAGAAAATAGTTGACTTGGCCAGCAATTCCGTGAATAATACAAATGTAACGATATCCAGAGGTTCAATATATTGTCCTGATCAACTTAACATACCTGGAGTAATTGCTGCTATGACTCGTCTTTGTGAACAACACTACCAGGAGTTCTGGTGCACTCTCAAGTGTGGACAGCTGGAGACCAGGGTTCAGCTGTTCCCTGCCCCCCAGCCTGCTTCACAAGACTGTCTAGGCGCTACATACACTTTGTCCAACCAGTTGCATGTCATTGGATTTTTAACACAACAGGATTTAGGTACCCCAATAGCAATAAGCAAGCATCTTGTTATACCACAAGCTCAAGTTGCTAGTAATGCTCCACATCGTGAAAACTATGATCCTAAAACACCCACAAAGGAAAGTAGCAGTTCTGACGGCACTTCTACTGATGATGATATGTCCGACCCGAGCAAAGTTCCTAACTTCTGTGTTCTACTACATGGAGCTCTTAAGGTTGAAGGCATGTCAGCAATAGTTCAGTTGGGTGTTGACTGGTGGGGTACTTTATCGGCTTGGTGTGAGGTGTCCCGTGCTAGAAGGTCCTGTCTGCTGCTGAGTGTGATGCGTCCTAGCGCCTCCGCAGCGCCCTGGCTTGGACCCTTAGATCAATTGGGACCCTCTGAAGATAATAGCACCTCTACGGAAACATTCCCCGTTCGTTCATGGCGATCATACAGCGGCGGTTCCGGTTACGCTTGGGCGCGACCACACACTTTGTTGGCGGACGTTCAGAAAGTATTACGACATGCTAGGAAGTTACCTGATAAGACTCAACATTTGTATAAGGAATTAAACCGTCTTCGTAGAGCAGCTATTTCACTGGGCTTCTCAGAATTGCTCACATGTGTGAGCACTGCCTTAGAGCGTGAATGTACCACGCTTCCCCCCTCAGCCCCACCAGAATGTGCCTTACAGCTGGCCCACGCTGCTGCCGCCCTTAGAGACCCCAGAACCGCTTTAGACGTGAAACATAAAATTCTTTACATCACGTTCGTATCAAGTATACCTTTTATGTTTAGTTTACAAGGTGACTTTGTTTTCGATGACTCCGAAGCTATTGTTAAAAATAAAGATATCAGCTCTGATTCATGGGTACAACCCTTCTTTAATGATTTTTGGGGAACAAATATCAGGAGTAATCTTAGTCATAAATCTTACCGGCCTTTAACTATACTTACTTACAGACTGAATTATTTTTTAAGCAACAAGAATTTAACTGCAACACAATTTAAAATCACCAATCTTTTATGTCATGTTGCTTGCTGTTTATTAGTGTGGAGAACATATAGTTGCATATGGGAAAGGTTTAAAGGAAAATATGTTATGTCAAGTACACTTAATGTGCCTGTAATAGCCACTTTGATGTTCGGAGTGCATCCTATTCATGTGGAAGCAGTCTGTGGAATTGTGGGACGAGCGGACTTGTTGTCTGCATTAACATTCCTTCTATCATTCCTAATCTACGATAAATCTATAAAGACTGACAGTTATATTTATTTATTTTTAAGTTTAATAATAGCAAGTGCTTCTATGTTCTTTAAGGAAAATGGTATAACTGTTCTGGGTGTTTCTTGCATATATGATTTATTGTGCAACATAAATAAGAGAGACAATAAAAAGAAATTAAGTGATTACACATGTCTCAAAAATATACACATTAATATCAAATGTGCTTGTAGAATAATTTGTGTTGTTGCCTCCGCAATCATTTTGCTTTACATGAGATGGATAATAATGGGCAGAAATACGCCAGAATTTAAACCGACAGATAACCCAGCTGCATTTTCGGACAGTATAATCACAAAGGTAGCTACATATAATTATATATATTTCTTAAATTTCACACTACTCGTTTGGCCGCAATGGTTGTGCTACGACTGGTCGATGGGATGCGTTCCACTTATAAATAGTGTTCTAGATTTTAGAATACTGCTGCCAGTGATCTTATATATATATGCAGTATTATTTGTTAAATTTGTTATTACCAACGGAATTCATTCATTTCCACAGGCAAGATTATTAATCATGTCAGTAGTTCTTATAGCACTACCATTTCTGCCAGCTTCAAATATAGTGTATCCAGTTGGCTTTGTTATAGCTGAAAGAATATTATACATACCATCTATTGGCTATTGTTTTTTGATAGCAATTGGAGCTAATAAAATAGTTAGAAAGATCAATAGAAAGGTGGTTATTTGCGGTTTTTACGCCATGATATTAATTTATTTATTGAAAAGTTGGAATAGATCATTTGATTGGAGGAATGAATATGATTTGTTCACGAATGCACTTAATGTGTGCCCATTGAATGCAAAGGTACATTACAATGTAGCTAAAGTAGCTGATGCCAAACAAAATAACAGCTGGGCTCTGGCAGAATATAAAGAAGCAATAAGACTGTATCCCGAGTATTACCAAGCGATGAATAATTTGGCAAATTTATTGAAAAATCAAAATCAATATACTGAAGCCGAACTATATCTTAAGAATGCTCTACACTATAAACAAGAATTCCCAGCAGCCTGGATGAACCTCGGCATAGTGTTGGCCAACACCAAGCGATATGAGGAATCTGACAACGCCTACAAAACTGCTTTGAAATATCGCAAAAAATATCCAGACTGTTACTACAATTTGGGAAACTTGTACTTAGAAATGAACAAAACAAACGAGGCAATAGAAAGTTGGCACAAAGCAATCAATTTGAATCCCAAACATGTATCTGCTTGGACAAATTTACTTGCCCTTTTAGATAACACGGGGCAAACTAACAGAGCGTTACGGATAATACCACAAGCCCTCTCGGACGTGCCCGAGATGCCGTCAATTAATTTCGCCATAGCAAATATTTACGGCAAAATAAACAACTATGTTGAAGCGGAAAATTACTTCAAGAAAGCCATCAATTTGTTTGGTGACAGAGTACAAGCTATTCACTTTGCGAATCTAGGAGTACTCTACCATCGTTGGAAGAAGTATGAGTTAGCAGAAGCAATGTACAAAACGGCTTTAAAAATCGATCCCAGATTTCCTAGTGCTAAAAAGAATCTCAACACATTAAATAAATTAAAAAATAACCATTACACACTCTTTTTATTTGTTGTAACATCACCAATAAATACAAGTTTGTCTTAA

Protein sequence:

>DPOGS208637-PA
MPTVILLDVSLSMSRPLPNSDSTETHTRFTLATAAINTFLDYLCVHAKLEYVALVTFSSLCEVSVPFTREFDNIRVKLPTLEEGDKTCIETALHGVNQLVLNEWGYQTAVQIILITDGSCGVGSIGRNRIIKALPLPPTYPGKIHTINLIISHSSMPLYQKIVDLASNSVNNTNVTISRGSIYCPDQLNIPGVIAAMTRLCEQHYQEFWCTLKCGQLETRVQLFPAPQPASQDCLGATYTLSNQLHVIGFLTQQDLGTPIAISKHLVIPQAQVASNAPHRENYDPKTPTKESSSSDGTSTDDDMSDPSKVPNFCVLLHGALKVEGMSAIVQLGVDWWGTLSAWCEVSRARRSCLLLSVMRPSASAAPWLGPLDQLGPSEDNSTSTETFPVRSWRSYSGGSGYAWARPHTLLADVQKVLRHARKLPDKTQHLYKELNRLRRAAISLGFSELLTCVSTALERECTTLPPSAPPECALQLAHAAAALRDPRTALDVKHKILYITFVSSIPFMFSLQGDFVFDDSEAIVKNKDISSDSWVQPFFNDFWGTNIRSNLSHKSYRPLTILTYRLNYFLSNKNLTATQFKITNLLCHVACCLLVWRTYSCIWERFKGKYVMSSTLNVPVIATLMFGVHPIHVEAVCGIVGRADLLSALTFLLSFLIYDKSIKTDSYIYLFLSLIIASASMFFKENGITVLGVSCIYDLLCNINKRDNKKKLSDYTCLKNIHINIKCACRIICVVASAIILLYMRWIIMGRNTPEFKPTDNPAAFSDSIITKVATYNYIYFLNFTLLVWPQWLCYDWSMGCVPLINSVLDFRILLPVILYIYAVLFVKFVITNGIHSFPQARLLIMSVVLIALPFLPASNIVYPVGFVIAERILYIPSIGYCFLIAIGANKIVRKINRKVVICGFYAMILIYLLKSWNRSFDWRNEYDLFTNALNVCPLNAKVHYNVAKVADAKQNNSWALAEYKEAIRLYPEYYQAMNNLANLLKNQNQYTEAELYLKNALHYKQEFPAAWMNLGIVLANTKRYEESDNAYKTALKYRKKYPDCYYNLGNLYLEMNKTNEAIESWHKAINLNPKHVSAWTNLLALLDNTGQTNRALRIIPQALSDVPEMPSINFAIANIYGKINNYVEAENYFKKAINLFGDRVQAIHFANLGVLYHRWKKYELAEAMYKTALKIDPRFPSAKKNLNTLNKLKNNHYTLFLFVVTSPINTSLS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: