MonarchBase - Protein-coding gene

DPOGS200134
Transcript	DPOGS200134-TA	2511 bp
Protein	DPOGS200134-PA	836 aa
Genomic position	DPSCF300128 - 633065-639843
RNAseq coverage	380x (Rank: top 31%)

Annotation
*Heliconius*	HMEL009440	0.0	78.28%
*Bombyx*	BGIBMGA002780-TA	0.0	80.83%
*Drosophila*	bon-PA	2e-09	21.28%
EBI UniRef50	UniRef50_F4WYL9	0.0	80.04%	E3 ubiquitin-protein ligase TRIM37 n=13 Tax=Coelomata RepID=F4WYL9_ACREC
NCBI RefSeq	XP_396821.2	0.0	76.53%	PREDICTED: similar to tripartite motif protein 37 [Apis mellifera]
NCBI nr blastp	gi\|328778878	0.0	76.53%	PREDICTED: hypothetical protein LOC413376 [Apis mellifera]
NCBI nr blastx	gi\|322796557	0.0	58.61%	hypothetical protein SINV_07059 [Solenopsis invicta]

Group
Gene Ontology	GO:0005515	1.4e-21	protein binding
	GO:0005622	8.7e-18	intracellular
	GO:0008270	2.4e-10	zinc ion binding
KEGG pathway	ame:413376	0.0
	K10608 (TRIM37, MUL)	maps->	Ubiquitin mediated proteolysis
InterPro domain	[298-424] IPR013322	1.5e-23	TRAF-type
	[292-423] IPR008974	1.4e-21	TRAF-like
	[143-265] IPR003649	8.7e-18	B-box, C-terminal
	[13-112] IPR013083	2.6e-12	Zinc finger, RING/FYVE/PHD-type
	[104-143] IPR000315	2.4e-10	Zinc finger, B-box
	[295-401] IPR002083	1.2e-06	MATH
Orthology group	MCL14782		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200134-TA
ATGGCTACAAGAGGTGATAAAGGAAATGGAAATGGCGAGGAACAAATCGTTGAGACGTTGGCAGAGGTGTTCCGGTGCTTCATCTGTATGGAGAAGCTGGTGGACGCCCACCTCTGTCCGCACTGTTCCAAGCTTTGTTGTTATGCTTGCGTGAGGCGATGGCTTACGGAACAAAGATCCCAGTGTCCTCACTGCCGAGCAGCTTTGCATCTTCATGAGTTAGTCAATTGCCGCTGGGTAGAGGAAGTAACACAGCAAATTGAAACCATGCAACAGAGTAATTCAGTGTGCCAAAGAGAAAACTTTAGGGATAGATGCCCGACACATCAAGAGAAGCTAACTGTTTATTGCTGGACTTGTCGCCGCTGTATCTGCCATCAGTGTGCTCTTTGGGGTGGTACACATACTGGCCATACATTCAAACCTCTTGAAGAAGTGTATGAACAGCATGTGACGCAGATCCGAGATGAAGTCTCCCAGCTACGACGTCGTCTATTGGAGCTTATCAGCCTAGTCCAGGATGTTGAAAGGAATGTCGAGTCGGTGCGTTCAGCAAAGGATGAACGTGTCCGTGAAATAAGAAATGCGGTTGAGCTGATGATATCTCGCCTGGACTCGGCGTTGAAAGCCAAGCTGCTGACTCTCATGGGACAGAAGAACAGTCTCACACAGGAAACAGAACAGTTGGAGCATTTGCTGCAGGAGATTGAACATCAGCTACACTCTAGCACCAGATCCGAACTGATAGCGAAGAGCGGCGATCTATCGAAAATGATCCATCAGGTCCGCAAGAAACCGATGGCGAGCTTCGTGACCGCGCCAGTACCGGCCGATTTTCATAGGCAAGTACAGTTCTACAATGAAATCGTGCCGAGCTACGACAGCAGCACCTTCCCGCTGAGCAACTTCACTCAGCTGCAGCACGCGGCGTCGCCCGTGTACTCCGCGCCGCTGCACGTGAACGGTCTGTGCTGGCGGCTCAAGGTATACCCTGACGGTAATGGCGTCGTGCGCGGCAACTATCTGTCCGTGTTCCTCGAGCTCAGCGCGGGTCTGCCGGAGACATCCAAGTACGAATATCGTGTGGAGATGCTGCACCAGGTGTCCCGTGACCCGTCCAAGAACATTGTACGGGAATTCGCTTCGGACTTCGAGGTTGGGGAGTGCTGGGGTTACAATCGCTTCTTCAGATTGGACCTTTTGGCGAGCGAGGGGTATTTGAACCCTGACACCGATACGCTCATCTTGAGGTTCCAAGTCCGCCCGCCGACCTTCTACCAACGCTGCCGCGACCAGCAGTGGTACATCAACCAATTGATAACCATACAGAACCAACACATACTACAGATTAATGATCTCAAAGAGCGTCTAACACTGGAGATGTCCCACAACACTTTGGTGCCGACCCGCGCGACCCCCAACCCGGTGACGTCACAGGCGGACGACAACCCCACACAGAACAACCCGGTGGATGGCAACAGCCTGAGCGACTCGCTCGTCTACAACCAGTGGAAGTTCAACAGTCCACCCAGTGTAATGAGCGGACAGAGGCTGACCAGCCCAGGTATTTTGAACACGGCGTTATTCGAGGATTCGTGTAGCAGCGTGTGTCGCAGCTCGCTGGGGGCGGGCGCCATATGCTACGGGGACTACGGCGGCGAACGTGCCAAGACCACGGCCCAGCACGCGCTCGACTCGCCGTACAACCTGCCTTCAACATCGAGGTCGGCGAGCTCGGTGCAAGCCACGAGCGGCGGCGGGGCGGGCGCGTCCGTGACGGGAGACAAGTTATCGCTGGTGTCACTGCACACACTGCTGAGCGCGGCCGGCGGCGCTCCTCGGCCGCGGGCCAGGCAGAGGCACGACTTCCTCACCGCGGACTCGCCGCTCATCGCGGTGGCGAGTACTCCGGTCAACGAGGTGAACTCGGCCAGTGGGAGCGGTGTGTGCGCGTCGCTGTCGTCACCCGAGCTGAGCGGGGAGGGGGCGAAGGCCGAGGCGGCGCCCGCCAGCCCCGAGCCGCAACCGAACGCCCCCTCGGAGTCCAGCAGCGATACCGGGCAGGACATCATGTTCAGTGAGTTGGATGGGTTCGCAGACGATAACAACCAGAGTCATGTGGAGGAGAACTCCAACGAGGAAAACGACGTGGACGAGGAGACCATGTCCGCAGCCATCACACGAAAAGACAATATGCATCCTAGTGAACCCCGTTTCATCCCATCCTATCCTATTCTATCCCATCCCTTGAATGTATCCTCCCGCCGCTCCTCAGAGGGGTCGTCCGGTAGCGGGTGCTCCTGGTGTGCGCTGGACGAGCGGCCTGGGTCCCCGGCGTCCCCTCCGTCTCCCCTGTCCCCATCCCCCGCGGGGTCCCTCTGCTCGGAGGCTCCGGTCCGCCGCCGCCTGCGACGCGCGGCGCCCTACCGCCGCTCCCGCCCGGCCTGTCCGCCAGCGGAGCCCTCGCCCTCCGCACACGTCGGATGCGTCGCCTTATATCGCATATCCTAG

Protein sequence:

>DPOGS200134-PA
MATRGDKGNGNGEEQIVETLAEVFRCFICMEKLVDAHLCPHCSKLCCYACVRRWLTEQRSQCPHCRAALHLHELVNCRWVEEVTQQIETMQQSNSVCQRENFRDRCPTHQEKLTVYCWTCRRCICHQCALWGGTHTGHTFKPLEEVYEQHVTQIRDEVSQLRRRLLELISLVQDVERNVESVRSAKDERVREIRNAVELMISRLDSALKAKLLTLMGQKNSLTQETEQLEHLLQEIEHQLHSSTRSELIAKSGDLSKMIHQVRKKPMASFVTAPVPADFHRQVQFYNEIVPSYDSSTFPLSNFTQLQHAASPVYSAPLHVNGLCWRLKVYPDGNGVVRGNYLSVFLELSAGLPETSKYEYRVEMLHQVSRDPSKNIVREFASDFEVGECWGYNRFFRLDLLASEGYLNPDTDTLILRFQVRPPTFYQRCRDQQWYINQLITIQNQHILQINDLKERLTLEMSHNTLVPTRATPNPVTSQADDNPTQNNPVDGNSLSDSLVYNQWKFNSPPSVMSGQRLTSPGILNTALFEDSCSSVCRSSLGAGAICYGDYGGERAKTTAQHALDSPYNLPSTSRSASSVQATSGGGAGASVTGDKLSLVSLHTLLSAAGGAPRPRARQRHDFLTADSPLIAVASTPVNEVNSASGSGVCASLSSPELSGEGAKAEAAPASPEPQPNAPSESSSDTGQDIMFSELDGFADDNNQSHVEENSNEENDVDEETMSAAITRKDNMHPSEPRFIPSYPILSHPLNVSSRRSSEGSSGSGCSWCALDERPGSPASPPSPLSPSPAGSLCSEAPVRRRLRRAAPYRRSRPACPPAEPSPSAHVGCVALYRIS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: