MonarchBase - Protein-coding gene

DPOGS214287
Transcript	DPOGS214287-TA	3546 bp
Protein	DPOGS214287-PA	1181 aa
Genomic position	DPSCF300014 + 2133891-2141642
RNAseq coverage	1557x (Rank: top 8%)

Annotation
*Heliconius*	HMEL011419	0.0	82.12%
*Bombyx*	BGIBMGA005999-TA	0.0	82.81%
*Drosophila*	CG6621-PA	4e-103	47.22%
EBI UniRef50	UniRef50_D6WJY6	0.0	58.20%	Putative uncharacterized protein n=2 Tax=Neoptera RepID=D6WJY6_TRICA
NCBI RefSeq	XP_974328.1	0.0	58.20%	PREDICTED: similar to CG6621 CG6621-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91082317	0.0	58.20%	PREDICTED: similar to CG6621 CG6621-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91082317	0.0	47.86%	PREDICTED: similar to CG6621 CG6621-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	2.9e-28	binding
	GO:0005515	9e-05	protein binding
KEGG pathway
InterPro domain	[286-424] IPR011990	2.9e-28	Tetratricopeptide-like helical
Orthology group	MCL17360		Patchy

Nucleotide sequence:

>DPOGS214287-TA
ATGGAACCAACTTTGGATGCGTCTTTGGTGGCGCAGTCCATAAATTATCATGGGCAGCAGCTACAAAAAACGTGGGAGGCCGAACGAGGTGAAGATGATTTATCCAAGATTGGTGTGGGGCCTTTAGACTTTGCTGTGTACCAGTCCAGGCACAAGCATTTGACTTTTCAAGACAGAGGGAAGAGACTCAAATTACATCAGTTCATCGCGAAGGAAGCATCAGCATTATTCGATGCATCTCTACTGGACGAAACTCCGTCATCTTCCAGCGTAAGCGCTGAAGCTCCTACACCAGAAGACAATCTATTTGCACTGATGCCGCCATTTGAAACATTTTTACATGTTGACAAATCAGACAGGCTGAGACATTTTTTTGATAATGTGAAAACAGGGGAGCTGATAATAGGTGCTGTTATCAACAGAACAGCATCAGGGATGATGCTTAAGGTGCTATGTACTGCTGGACCTACTTCTAGATATGTTGCTGACATCAATGTTAAGGCATTCTTACCTGTTGCTAATATCATACCGGCGGTGGACAAGAAAAATGTATCGAGAAACTACCTGATGAATGATACTGTGTGCTGTGAAGTAATTGAAGTTATTCCCGACACTGACAAAATGGTGTGCGGCATGAAGGGTGTTACTCGGAAGCCTGAAGATTCTCCACCGAAGCCTCCGCTAGGCCTCCTCAGCACTGACGACTTTCCTTTGATATACAAGAAAACTATGGAAATGAAGGGAGAGAGTTATGAAGCTATTTTGGAGAAGAGCCCAGGATTCAATAATCCTAACTGCGTCCAATATCTCTCAGAACTTCTTGGCATATCAAATATGCATTGCAGCAATTTTTCAACATTAAGGGGAGGATTTTCAGCTGCAGAATATGCTGATGAACTCCGTCAAGCTCAAGCAAGCAAGTGGGCATTCCGGTCAGTAGCTGAAGGAATTGAACACTTTAAAGCAGGAAGACATTCAGAAGCATTTCAATGTCTCAATAAAGCACTCAGCATTGATCCCCGAAACGTAGAAGGCCTTGTTGCGAGAGGTGCTCTGTATGCTAATAGTGGAACATTTAAGAAAGCCATAGAAGACTTTGAAACTTCTCTAAAACTGAACCCTAACCATGCAAATGCACGAAAATATTTGGGAGAAACGTTAGTCGCTCTCGGACGCAGCTATGAAGATGAGAACAAAATTGCTGAAGCCCAAAAAGCTTACGAGGATTGTTTGGCGATTATACCATTCCATGAGGAGGCTCAGAATTCACTAGACTTTCTGAAGAGTAAGACGTCTACCACCAAGCCATTAATAGAGCCGGCCGAGTTACTTCTACCTGGATTAACAGGAGCTAAATCGTTTGAGATGAAAGAAACACTGAAGCAATTGTTGAATCTAACAGAGAAGAAGGAAAAGAAGAAGAAGAAGAAGCGTGGGAAAGGCAAAAAGAAGCGCTCCAGTAGTTCCTCGTCGTCTTCGAGTGACTCGTCGAGCTCGAGCTCCTCGTCCGAGTCATCGTCCTCGTCAACAGAATCTAGTGGTTCAGAGGGTCCAAATAGGAAGAAGAAACGTCGCTCGCAATCAAACAACAAGCGACAGAGGTCGCTGTCGCCTCTGAGCAAGCGTATGGCTATGCTGGGAGACGCTGAGTCGGCGTCACGTACACACAACTCGCAGTTCAACCACCCGTATGGTTATCAGCCGCCGCCGCCCGCAGAAGAACCCGCCGCGCCCGGCAGGTCTCAGGCCGATATTGATTATGAATTGAAGGTACGCAAGTTCCTGGACATGACGAAAGAAGATTCTGATTATGAAGAAAAAGTTCGAAACTTCTTGGAAGAGACGGCGCAATACAAACGAAATCGAAAAATGCAAGAACTCGGTCAGCAGACACAACCGGGCGCTGAACATGATAAGAAGAAGAAGAGAAAGAAGGATAAGAAAAAGAAGAAGGAATCAAAACGCAAACGCAAAGAACAAGAGAGAGAAGAGAAAAGAAAAAATAAGATCGCTCGTATGTCAAACAGTTCCGATTATAATCTACGTGATATAGAAAATATTGGTGATAAAAAACTGAGAGATGCTATAAGAAAAGAATTGAAAGGAAAATCAAAGAGAGATCACAGTTCAGATGGTGAATATGAAAAAAAACACAATGAAAAGAGTCGCATACTTGATGAAATGCACGGACTGGAGGAGCTTGAATCCAAGCTGAGTGCGTACCACGTGATGGTGGAAAAGGAAATCGGTAAACGAGACAGATCTCTCAGTCCGCTGGACCAGGTGCCGCCGCCGCCGCTTGACAAGCCCAAGTGGAAAATGTCAATGAACGCTGTCAAAGAAACGGTCAAGAAGAAGGATACTCCAGTACAAAAAGGATACAAGGAGCGTTACGCATTTGAAGATAGCTCTGACGACTCTCAAGATCCTCGAAAGCCGTCACCATCGAGCGGCGACAAGAATGTGTCTGTTCGACGCGCAATGGCCATGTCTATGAAGGAGCCGCCGCCGCTACCGTCAGCGCCGCCACCCAAGAGCAGCCGCGAGCCCGACCCGCCTGGCACGGACCCGCCGCACACACATCAACACCCACACACGCACCCGCACCCACATCTGCACCCTCCTCACGCACCCCCGGTGCGTAAAGGTAATATAGTGCTGGACAAGTTTGGATCATTCCGATTGGCTCAAGAAGGTGAGACGCCGGTGTCTGTAGGAGACGGACGACCAGAACAGTTCGTGACCCGCATCAAGCCGCCGACGCCCTCACAACGAAGACCTCGCTCACCACCATCACCCAGGAGAAGGTCATCCAACTCCTCTGACGATAGACGCTCGGCTAAACGATCTAGAAGCCGTTCCATGCCACGGAAGTATCGTTCCCGCTCCGGATCCCGTTCCCGTTCCGGTTCCAGCGCGAGTGGCTCGGTGGCGTCTCGCCGCAGTCGCACCGTGTCGCCGAGATATCGCTCCAGATCTGATTCCTACTCACGAAGCAGATCACGCTCTCGATCGGGATCGCGCGACAGAAATCGTCGCATGAATCGTCGCGGCAATTGGCGCGGACGCGGCGGTTTCGAGCGTGGCACCTACTACCGTCCCCGTTTCCACACTTACAATGGTGGCGGGAACCGTGGTAGGGGGCGCGGTGACTTCCGCAGGGACGACGGACGTCGCTTCCAACACGAGTGGAGGGATAATCGATCTCGTGGAGGACGGCCTTTCAGACCCAGGAGAGGAGGCGGCGGACGCGGCAGACCTTTCAGGGGTGGCTTCCGTGACTTCCGCGACAGACGCGGCGGTAGATATTCCCGGTCCCGCAGCCCCGACAGAACACGCAGGTCCAGGTCATACAGCCCGGAGAGAAGAGACAAGGACAGAGACAGCTTCTCTCGTTATTCTGAACGCGACAGCCACCGTAGTGAAGGAGAGTACGAGGAGGAGCGTTACGTGGACAGGAAGGAGTATGACGGGAAGTGGGCGGACGGGAACGAGCCAGAACGAGCACACGCCGAGGAAAAGACGGAGGAACCGCCTAAAGAATAG

Protein sequence:

>DPOGS214287-PA
MEPTLDASLVAQSINYHGQQLQKTWEAERGEDDLSKIGVGPLDFAVYQSRHKHLTFQDRGKRLKLHQFIAKEASALFDASLLDETPSSSSVSAEAPTPEDNLFALMPPFETFLHVDKSDRLRHFFDNVKTGELIIGAVINRTASGMMLKVLCTAGPTSRYVADINVKAFLPVANIIPAVDKKNVSRNYLMNDTVCCEVIEVIPDTDKMVCGMKGVTRKPEDSPPKPPLGLLSTDDFPLIYKKTMEMKGESYEAILEKSPGFNNPNCVQYLSELLGISNMHCSNFSTLRGGFSAAEYADELRQAQASKWAFRSVAEGIEHFKAGRHSEAFQCLNKALSIDPRNVEGLVARGALYANSGTFKKAIEDFETSLKLNPNHANARKYLGETLVALGRSYEDENKIAEAQKAYEDCLAIIPFHEEAQNSLDFLKSKTSTTKPLIEPAELLLPGLTGAKSFEMKETLKQLLNLTEKKEKKKKKKRGKGKKKRSSSSSSSSSDSSSSSSSSESSSSSTESSGSEGPNRKKKRRSQSNNKRQRSLSPLSKRMAMLGDAESASRTHNSQFNHPYGYQPPPPAEEPAAPGRSQADIDYELKVRKFLDMTKEDSDYEEKVRNFLEETAQYKRNRKMQELGQQTQPGAEHDKKKKRKKDKKKKKESKRKRKEQEREEKRKNKIARMSNSSDYNLRDIENIGDKKLRDAIRKELKGKSKRDHSSDGEYEKKHNEKSRILDEMHGLEELESKLSAYHVMVEKEIGKRDRSLSPLDQVPPPPLDKPKWKMSMNAVKETVKKKDTPVQKGYKERYAFEDSSDDSQDPRKPSPSSGDKNVSVRRAMAMSMKEPPPLPSAPPPKSSREPDPPGTDPPHTHQHPHTHPHPHLHPPHAPPVRKGNIVLDKFGSFRLAQEGETPVSVGDGRPEQFVTRIKPPTPSQRRPRSPPSPRRRSSNSSDDRRSAKRSRSRSMPRKYRSRSGSRSRSGSSASGSVASRRSRTVSPRYRSRSDSYSRSRSRSRSGSRDRNRRMNRRGNWRGRGGFERGTYYRPRFHTYNGGGNRGRGRGDFRRDDGRRFQHEWRDNRSRGGRPFRPRRGGGGRGRPFRGGFRDFRDRRGGRYSRSRSPDRTRRSRSYSPERRDKDRDSFSRYSERDSHRSEGEYEEERYVDRKEYDGKWADGNEPERAHAEEKTEEPPKE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: