MonarchBase - Protein-coding gene

DPOGS204773
Transcript	DPOGS204773-TA	2532 bp
Protein	DPOGS204773-PA	843 aa
Genomic position	DPSCF300231 + 233759-335638
RNAseq coverage	19x (Rank: top 80%)

Annotation
*Heliconius*	HMEL002936	9e-138	53.30%
*Bombyx*	BGIBMGA013723-TA	5e-102	66.20%
*Drosophila*	CG4050-PA	2e-71	32.25%
EBI UniRef50	UniRef50_UPI00021A88EF	0.0	48.21%	UPI00021A88EF related cluster n=6 Tax=unknown RepID=UPI00021A88EF
NCBI RefSeq	XP_973900.2	6e-161	43.11%	PREDICTED: similar to smile protein [Tribolium castaneum]
NCBI nr blastp	gi\|270001551	0.0	48.50%	hypothetical protein TcasGA2_TC000396 [Tribolium castaneum]
NCBI nr blastx	gi\|270001551	0.0	49.58%	hypothetical protein TcasGA2_TC000396 [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	1.3e-25	binding
	GO:0005515	8.4e-05	protein binding
KEGG pathway
InterPro domain	[263-338] IPR013618	4.5e-28	Domain of unknown function DUF1736
	[424-642] IPR011990	1.3e-25	Tetratricopeptide-like helical
Orthology group	MCL15715		Patchy

Nucleotide sequence:

>DPOGS204773-TA
ATGAAACGAAGACTCCCAATTGTGAAAGAAGAGAAGAGAAGCCCTAAGAATATTTGTAACAGTGATCTTGCTATTTATACGATGGTGATATCAACGGCGGTTTTAAGTTATGTAAACAGTTTGAACGGTGACTTCGTTCACGACGATATACCGGCTATAGTGACGAACGGTGACGTGGTAGGGAGAGGCAGTATTAGAGAGTTGTTTTTGAACGACTTCTGGGGCACGGCGATGGTTGATCCCAATAGCCATAAATCATATCGCCCCTTGACGACGTTATCATTTAGGATAAATTACGCATTAACTGGTTTAAAGCCATGGTGGTGGCACGCTTGCAATGTTCTGTTGCACGCAGCGTGTTGCGCGTTAGTCGCGCGGGCATGCGTGACGATCGCGCGTTTACAAAGACCGTTCGCCGCATTAGCGGCATTGCTGTTTGCGGTACATCCTGTTCATACCGAAGCGGTAGCCGGTGTGGTAGGCAGGGCGGATGTACTCGCTTGCATATTTTTCCTATCCTCGCTTCTAGTTTATCATAGACCGACGAGTAACAAGAAATGCGTATGGTTGAGTATTATTTTGGGAGCTCTGAGTATGCTGGCCAAGGAGACTGGCGTCACAATCCTGTTGCTCAACCTGGCTATTGACTTCTACAGATGTTGGCCATTCGTAAAAAGATCATTATGTACGTTGAAGTTTGAAAAAAAATGTTCTGGTCTTTCAATAAGGACGACAAAAGTGCTTGTATCACTGGCTCTATTGGTTTCTCTTCGCCTGGCGTTGCTACAAGGGACATGGCCAACATTCTCGCCCCAGGACAATCCGGCTTCTTTCCACCCGAGCTTTTTCGTGAGGTTGATGACTTTCTGCTACTTGGCGGCTTTCAATTGGTGGTTACTACTGTGTCCGTGGTCTCTAAGTCACGATTGGCAGATGGGTTCTGTTCCACTCATCGCTAGTGGATGGGATCCCAGAAACTTGTTGACATGTGCTGCTTTTGGTGCTTTGCTGGTCCTTTGCTATAGATGTGTTGCAGATTTAGACGTACAAAAACATACGCCTGCTGTTATTGGCTTACTGTTGCTGGTGGTACCATTCGTGCCGGCCAGCAACCTACTCGTCACCGTTGGATTTGTCATTGCTGAAAGAATTCTTTACATACCTAGCGTTGGAAGCGTCATTATAACAGCCTACGGTGTGCAACTTATGTGGTATTCAAAGCCAGGGACCAAGATATGTTTGATTGTGGGACTTGCGGTGCTCGCTGCTAGCGGTGTGGCAAGAACGTATAAAAGGAATGCCGACTGGAAAGATCGAGCAACATTACTTAGAGCGGATTTAGTGACTTTGCCGCAGAATGCCAAACTGCACTACAACTTTGGCAACTTCCTTCGAGAAACAGAGCAGCAAGACAACGCTATCAAACATTACAAAGAAGCTTTGAGGTTATGGCCGACGTACGCGAGTGCTCACAATAATATTGGCACTCTCAGTAACGCGGAGAACGCAGAACAGCACTTCTTATCAGCGATCGCACACAACAGATACCACGTGAATGCGCACTACAATCTGGCGAAACTTTATAAGAAAGGTGGCCGAATAAACCAGGCTGTGAGAATACTCGAGCGCTGTGTGGTACTCCAGCCACGTTTTGTTCAAGCCTACATTGAATTGCTGTCCTTGAAGCCGGAACCTGAAAAGGCGAGAATATTGGCACGAGTAGTTGAATTGGAGCCCAATAATTGGGAGCATTACATTTTATATGGAAACTGGTATAGGAATAAAGGATTACCGGGAGCCGCCGCAAAATATTTCGTGGAAGCCACAAGACTTAGTTTCAGAAATAGGAATGTTGAAAAAGCAATGAGGGGTGATTTGATCTCACTCCGATCAACGGCGCTTGTATACAGGAGTCTGGGACAAAAATCGAGGGTTCTTCAACTTTTAACCAGATGGCACACTTGGCGTCGTGGTTGGCCGAGTACTGCTGCTGCCCACATGTACTTACAGGAGTGGCGTCTGAAGATGGAGCTAGAAGGGCGAGTTCAGATTTATTCGAAAGCTGTCAATCCAACTAAATCGAAAACCTGTTTCGACCACTCACAACTAGCAGTTGGATCTCCCGCAGCTAATGAAGAAAAAATTTCAAAATACGAGGAAAGAATTAAAGAAGAACAAGTTATAGATAATACAGAACTTGCTTTTGATACAAAATTAACAGTTGATAGAACGTGTGATAGAAAAGAATGTGAGGGTAAACGTGATCTCTCAAAATCGAAAACCTGTTTCGACCACTCACAACTAGCAGTTGGATCTCCCGCAGCTAATGAAGAAAAAATTTCAAAATACGAGGAAAGAATTAAAGAAGAACAAGTTATAGATAATACAGAACTTGCTTTTGATACAAAATTAACAGTTGATAGAACGTGTGATAGAAAAGAATGTGAGGAGCAAGACTATAACGCAGAAGAAAACCGCGACCACCACCACCACGACCACGATGTAGCTACCCCTCCTTTTTTAGCGGCTTAG

Protein sequence:

>DPOGS204773-PA
MKRRLPIVKEEKRSPKNICNSDLAIYTMVISTAVLSYVNSLNGDFVHDDIPAIVTNGDVVGRGSIRELFLNDFWGTAMVDPNSHKSYRPLTTLSFRINYALTGLKPWWWHACNVLLHAACCALVARACVTIARLQRPFAALAALLFAVHPVHTEAVAGVVGRADVLACIFFLSSLLVYHRPTSNKKCVWLSIILGALSMLAKETGVTILLLNLAIDFYRCWPFVKRSLCTLKFEKKCSGLSIRTTKVLVSLALLVSLRLALLQGTWPTFSPQDNPASFHPSFFVRLMTFCYLAAFNWWLLLCPWSLSHDWQMGSVPLIASGWDPRNLLTCAAFGALLVLCYRCVADLDVQKHTPAVIGLLLLVVPFVPASNLLVTVGFVIAERILYIPSVGSVIITAYGVQLMWYSKPGTKICLIVGLAVLAASGVARTYKRNADWKDRATLLRADLVTLPQNAKLHYNFGNFLRETEQQDNAIKHYKEALRLWPTYASAHNNIGTLSNAENAEQHFLSAIAHNRYHVNAHYNLAKLYKKGGRINQAVRILERCVVLQPRFVQAYIELLSLKPEPEKARILARVVELEPNNWEHYILYGNWYRNKGLPGAAAKYFVEATRLSFRNRNVEKAMRGDLISLRSTALVYRSLGQKSRVLQLLTRWHTWRRGWPSTAAAHMYLQEWRLKMELEGRVQIYSKAVNPTKSKTCFDHSQLAVGSPAANEEKISKYEERIKEEQVIDNTELAFDTKLTVDRTCDRKECEGKRDLSKSKTCFDHSQLAVGSPAANEEKISKYEERIKEEQVIDNTELAFDTKLTVDRTCDRKECEEQDYNAEENRDHHHHDHDVATPPFLAA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: