MonarchBase - Protein-coding gene

DPOGS205291
Transcript	DPOGS205291-TA	3165 bp
Protein	DPOGS205291-PA	1054 aa
Genomic position	DPSCF300021 + 469838-480781
RNAseq coverage	637x (Rank: top 20%)

Annotation
*Heliconius*	HMEL017480	98.67%
*Bombyx*	BGIBMGA011033-TA	96.69%
*Drosophila*	sxc-PC	85.78%
EBI UniRef50	UniRef50_E2C6I4	80.09%	UDP-N-acetylglucosamine--peptide N-acetylglucosaminyltransferase 110 kDa subunit n=19 Tax=Arthropoda RepID=E2C6I4_HARSA
NCBI RefSeq	XP_967579.2	90.75%	PREDICTED: similar to AGAP006254-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270004555	89.23%	hypothetical protein TcasGA2_TC003916 [Tribolium castaneum]
NCBI nr blastx	gi\|380019749	88.54%	PREDICTED: UDP-N-acetylglucosamine--peptide N-acetylglucosaminyltransferase 110 kDa subunit-like isoform 2 [Apis florea]

Group
Gene Ontology	GO:0005488	6.1e-75	binding
	GO:0005515	9.3e-09	protein binding
KEGG pathway
InterPro domain	[273-522] IPR011990	6.1e-75	Tetratricopeptide-like helical
	[108-141] IPR001440	9.3e-09	Tetratricopeptide TPR-1
	[108-141] IPR019734	4e-08	Tetratricopeptide repeat
Orthology group	MCL11196		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205291-TA
ATGCAACCTCAAGCGAATGTTGCCGTGCCTCAATCTGTCACGACGCAGCCTCAACAAATTGTCAGCGTTCCTGCAAATGCTGTGATCTTGAAAATGTCGGAAATTCAACAGATATCTACAGTGGGACTCCTGGAGCTTGCACACCGGGAATATCAAGCTGGAGACTATGATAGTGCGGAACTGCATTGTATGCAGCTATGGCGTCAAGATGGCACAAATACGGGTGTTCTTTTGCTGCTGTCCTCCATACATTTTCAATGTCGGCGTTTAGACAAATCAGCACATTTTTCAACGCTTGCTATAAAACAGAATCCTCTCCTGGCGGAGGCGTACAGTAATCTCGGAAATGTATACAAGGAGCGTGGGCAGTTGCAAGAGGCTTTGGAAAACTATCGTCACGCTGTCCGTCTAAAGCCAGATTTCATTGATGGGTACATCAACTTGGCAGCTGCCTTGGTGGCTGCAGGAGACATGGAACAGGCTGTACAGGCTTATGTTACAGCATTGCAGTATAATCCTGAACTTTACTGCGTTAGAAGTGACCTGGGCAATTTGCTCAAGGCCCTTGGACGTTTGGACGAAGCGAAGGCTTGTTACTTGAAGGCCATCGAAACGAGGCCAGACTTTGCAGTGGCATGGAGTAACCTAGGATGCGTTTTTAACGCACAAAGTGAAATCTGGTTGGCCATACATCATTTTGAAAAGGCCGTGGCATTGGATCCGAATTTCTTGGATGCTTATATCAATCTAGGAAATGTTCTCAAAGAAGCGAGAATTTTTGACAGGGCGGTGGCTGCATATTTACGAGCTCTTAATTTATCGCCGAACAATGCAGTTGTTCATGGTAATTTAGCGTGCGTGTATTATGAACAAGGACTTATTGATTTAGCGATCGACACTTATCGGCGAGCTATAGAACTTCAACCGAATTTCCCAGATGCCTACTGTAATTTGGCTAATGCATTAAAGGAAAAGGGTCAAGTGGTTGATGCGGAGGAATGTTATAATACTGCTCTAAGGTTGTGCCCATCACACGCTGATTCATTAAATAACTTAGCGAACATCAAACGCGAGCAAGGATACATAGAGGAAGCGACTCGTTTATATTTAAAAGCTTTGGAAGTATTTCCCGAGTTTGCAGCAGCTCATAGTAACTTGGCGTCAGTTTTGCAACAACAAGGCAAACTAAACGAAGCACTCATGCATTATAAAGAGGCTATACGTATACAGCCAACGTTTGCTGATGCTTATAGTAATATGGGCAATACTCTTAAAGAAATGCAAGACGTCGCTGGAGCATTGCAGTGTTATACCCGAGCTATACAAATTAATCCAGCGTTTGCCGATGCTCATAGCAATCTTGCCAGTATCCACAAAGATTCGGGAAATATACCGGAAGCTATACAGTCCTATAGAACAGCGTTGAAGTTGAAACCGGACTTCCCTGACGCGTATTGTAACTTGGCGCACTGTTTGCAAATCGTTTGCGATTGGACCGACTACGAGGCCCGTATGAAGAAATTAGTCAGTATTGTGGCAGAACAGCTTGAAAAGAATAGACTACCCTCGGTTCATCCTCATCATTCTATGCTTTACCCATTGACGCATGAATTCAGAAAGGCTATTGCGGCCCGACATGCGAATTTATGTCTGGAGAAGGTTCAAGTTCTCCACAAGCCGGCTTACAAATTTCCAAGAGAGCTGCAAAGCCGCCTGCGTATCGGTTATGTAAGCAGTGATTTTGGCAATCACCCAACATCACATTTGATGCAATCTGTGCCCGGATTACACGATCGTACTAAGGTCGAGATCTTTTGTTACGCTCTTAGTCCAGATGATGGTACAACATTCCGTTCTAAAATAGCTAGAGAAGCCGAGCACTTTATTGATCTATCACAGATTCCATGCAACGGCAAAGCTGCCGATAAAATATATTCTGATGGTATTAATATTCTGGTAAACATGAACGGATACACAAAGGGTGCCAGGAATGAAATATTTGCTCTACGTCCGGCTCCTGTGCAAGTAATGTGGCTCGGATATCCAGGCACAAGTGGTGCAAGTTATATGGACTACTTAGTAACTGATGCTGTAACATCTCCAGTCGAATTGGCAAGTCAGTACAGCGAGAAGCTCGCATACATGCCTCATACATATTTCGTCGGCGACCACAAGCAGATGTTCCCCCACTTACAGGAGAGATTGATAGTTAGTGACAAAATCAAATCCCATAATAACATGGGCAGTCTAGCTGATAATGTCGCCGTCATTAATGCAACTGATTTGTCTCCACTTGTCGAAAACACTGATATCAAAGAAATTAAAGAAGTTGTAAGAGCAGCGAGGCCGGTTGAAATATCATTGAAGGTCGCAGAGTTACCTACTACTACGCCTATAGAAAACATGATTGCTTCGGGACAAGTACAGACATCTGTAAATGGTGTCATCCTTCAAAACGGTCTGGCCACAACACAAACAAACAACAAAGCGGCTACAGGAGAGGAAGTGCCACAGTCTATTGTAATCACAACAAGACAACAGTACGGTCTACCGGATGATGCAGTGGTCTACTGTAATTTCAATCAACTGTATAAGATAGATCCGCTAACTCTACACATGTGGGTATACATATTGAAACACGTCCCTAACAGCGTGTTGTGGCTTTTGAGATTCCCGGCTGTCGGTGAACCTAATTTACAAGCAACGGCGCAGCAGTTGGGATTACCTCCCGGCCGTATAATCTTCTCAAACGTGGCTGCTAAAGAGGAGCACGTGAGGCGCGGTCAACTGGCGGACGTATGTCTAGACACACCCTTATGTAACGGTCACACTACTAGTATGGATATTTTGTGGACAGGCACCCCCGTTGTTACATTACCAGGAGAGACATTAGCCTCACGGGTGGCTGCATCACAACTCAATACACTTGGTTGTCCTGAACTGATTGCGAGAACGAGACAGGAATATCAAGACATAGCTGTACGATTAGGAACGGACAGGGAATATCTTAAAGCAATCCGAGTGAAAGTATGGACAGCTCGCACGGAGAGTCCACTATTCGACTGCAAAGCATACGCCACCGGTTTGGAGATGTTGTACAACAAAATGTGGTCGAGGTACGCTCGCAACGAGCGACCCGACCACATACAGGCCATAGACAAATAG

Protein sequence:

>DPOGS205291-PA
MQPQANVAVPQSVTTQPQQIVSVPANAVILKMSEIQQISTVGLLELAHREYQAGDYDSAELHCMQLWRQDGTNTGVLLLLSSIHFQCRRLDKSAHFSTLAIKQNPLLAEAYSNLGNVYKERGQLQEALENYRHAVRLKPDFIDGYINLAAALVAAGDMEQAVQAYVTALQYNPELYCVRSDLGNLLKALGRLDEAKACYLKAIETRPDFAVAWSNLGCVFNAQSEIWLAIHHFEKAVALDPNFLDAYINLGNVLKEARIFDRAVAAYLRALNLSPNNAVVHGNLACVYYEQGLIDLAIDTYRRAIELQPNFPDAYCNLANALKEKGQVVDAEECYNTALRLCPSHADSLNNLANIKREQGYIEEATRLYLKALEVFPEFAAAHSNLASVLQQQGKLNEALMHYKEAIRIQPTFADAYSNMGNTLKEMQDVAGALQCYTRAIQINPAFADAHSNLASIHKDSGNIPEAIQSYRTALKLKPDFPDAYCNLAHCLQIVCDWTDYEARMKKLVSIVAEQLEKNRLPSVHPHHSMLYPLTHEFRKAIAARHANLCLEKVQVLHKPAYKFPRELQSRLRIGYVSSDFGNHPTSHLMQSVPGLHDRTKVEIFCYALSPDDGTTFRSKIAREAEHFIDLSQIPCNGKAADKIYSDGINILVNMNGYTKGARNEIFALRPAPVQVMWLGYPGTSGASYMDYLVTDAVTSPVELASQYSEKLAYMPHTYFVGDHKQMFPHLQERLIVSDKIKSHNNMGSLADNVAVINATDLSPLVENTDIKEIKEVVRAARPVEISLKVAELPTTTPIENMIASGQVQTSVNGVILQNGLATTQTNNKAATGEEVPQSIVITTRQQYGLPDDAVVYCNFNQLYKIDPLTLHMWVYILKHVPNSVLWLLRFPAVGEPNLQATAQQLGLPPGRIIFSNVAAKEEHVRRGQLADVCLDTPLCNGHTTSMDILWTGTPVVTLPGETLASRVAASQLNTLGCPELIARTRQEYQDIAVRLGTDREYLKAIRVKVWTARTESPLFDCKAYATGLEMLYNKMWSRYARNERPDHIQAIDK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: