MonarchBase - Protein-coding gene

DPOGS201048
Transcript	DPOGS201048-TA	2940 bp
Protein	DPOGS201048-PA	979 aa
Genomic position	DPSCF300299 + 135912-154020
RNAseq coverage	107x (Rank: top 60%)

Annotation
*Heliconius*	HMEL005361	1e-101	78.45%
*Bombyx*	BGIBMGA012489-TA	0.0	87.87%
*Drosophila*	coro-PB	4e-111	47.38%
EBI UniRef50	UniRef50_F4WLT3	0.0	69.02%	Coronin-2A n=13 Tax=Coelomata RepID=F4WLT3_ACREC
NCBI RefSeq	XP_001606043.1	0.0	69.67%	PREDICTED: similar to ENSANGP00000029333 [Nasonia vitripennis]
NCBI nr blastp	gi\|383856889	0.0	71.07%	PREDICTED: coronin-2B-like isoform 1 [Megachile rotundata]
NCBI nr blastx	gi\|383856889	0.0	70.59%	PREDICTED: coronin-2B-like isoform 1 [Megachile rotundata]

Group
Gene Ontology	GO:0005515	7.3e-56	protein binding
KEGG pathway
InterPro domain	[41-973] IPR015505	1.2e-255	Coronin
	[102-733] IPR011046	7.3e-56	WD40 repeat-like-containing domain
	[257-393] IPR015049	1.2e-54	Domain of unknown function DUF1900
	[507-738] IPR015943	2.3e-38	WD40/YVTN repeat-like-containing domain
	[45-106] IPR015048	1.3e-31	Domain of unknown function DUF1899
	[513-545] IPR019781	8.1e-10	WD40 repeat, subgroup
	[502-545] IPR001680	3.2e-07	WD40 repeat
Orthology group	MCL14602		Patchy

Nucleotide sequence:

>DPOGS201048-TA
ATGCCTCCTGTAAAAGATGATCTGATTTTTAACTGTGTAGAGGTAAACATACCTGAAAAAAGCCCAGGAAAAGGTACAGCATTAGTAGATGTGAGGGCCTGTAATAAACCTGCCGCTAAGGTATGGTTCCGTGGAGTTCGTAGCTCGAAGTTTCGTCACGTGTACGGTGTGCCGTTCAAACGTGAGAGATGCTATGATAATATAAAAATAACGAGAAACGCCCACGATTCCAACTTCTGTGCCGTGAACCCCAAGTTTGTGGCTATCGTCACCGAAGTTGCAGGCGGGGGAGCCTTCCTAGTACTGCCTTTGGATCACGTGAAGATATGGCACATCCCTGATGGTGGCCTATCTATGCACCTCACCGACTGGCTGGTTGAGCTCCACGGGCACAAGAGGCGTGTGGCCTACATAGAGTGGCATCCCACGGCTGAGAACATACTGTTTAGTGCTGGATTCGATTATCTGATCTTTGTATGGGATGTGGGCAAGGGCGAGGCTGTTAAGGTCATCGATTGCCACAGTGACGTCATCTATTGCATGTCCTTCAATCGTGACGGATCACTGTTAGCGACCACCTGCAAGGACAAGAAACTACGGGTTATAGAGCCTAGGCGAGGGATCGTGCTGTCTGAGGGGCCCTGTCACCTCGGCACCAAGGCTTCCAAGTGCACGTTCCTTGGCGCTCAGTGCAAAGTATTGACAACTGGTTTCTCGCGACACAGCGACCGTCAGTACGCCGTTTGGGACCAACACGACGTGAGCGAGCCCCTCGCCTCCGAGACCATCGACAGCTCCTCAGGAGTCGTCTTCCCCTACTACGATCACGATACCAACATGGTCTATCTGGCTGGCAAAGGCGACGGCAACATCCGTTACTACGAAGTAGTGGACGAGGCGCCCTACGTGCATTTCCTCAACCAGTTCCTGTCAGGCAACCCTCAGCGTGGTCTGGGCTTCATGCCTAAGCGTGGCGTGAACACATCTATGTGCGAAGTGTTCCGTTTCTACAAGCTGCACACATCCCGTGGCCTCTGCGAGCCCATATCTATGATCGTACCGCGCAAGTCCGACTGCTTCCAGGAGGATTTGTACCCTGACACGGCCGCTCCTCAGCCGGCCCTCTCAGCACGCGACTGGCTCAGCGGAGTAAATGCACCGCCACTACTCATTAGTATGAAAACAGGGGTGACGATATCCACGCACAAGCCCCGGAACAACAAGGACGCGCCCGCGCTGCAGCCGCAGGACGCCAACAACAGAAAGAAGTTCGCCTTTCTGTCGCGTGAGACGACCCCCGACTACCGCCCTCTAGCGACGTGGCAGGGCAACCAGGACGATACGCAGGTTCAAGTGACGGAGAAGTGTCAGAAGCAGAACACCAACCAGAACACGAAGTTCCACCAGCTCCAGAGGATGTTCGGCAAACAGGCCGGTGACGTGGAAGTAGTGCCGCTCTACAAACAGATCAACCAGGGAGACGTTTTCAACACGGAGCACGAGACGGGGCGTCTGGATTTCAACGCCAGCCGCGTCACCGGCCACAAGGGTCCAGTGTTGGATATCAAGTGGAACCCGTTCAACGACAATGTCATAGCCTCCTGCTCTGACGACTGCACGGTGAAGATATGGCACATCCCTGATGGTGGCCTATCTATGCACCTCACCGACTGGCTGGTTGAGCTCCACGGGCACAAGAGGCGTGTGGCCTACATAGAGTGGCATCCCACGGCTGAGAACATACTGTTTAGTGCTGGATTCGATTATCTGATCTTTGTATGGGATGTGGGCAAGGGCGAGGCTGTTAAGGTCATCGATTGCCACAGTGACGTCATCTATTGCATGTCCTTCAATCGTGACGGATCACTGTTAGCGACCACCTGCAAGGACAAGAAACTACGGGTTATAGAGCCTAGGCGAGGGATCGTGCTGTCTGAGGGGCCCTGTCACCTCGGCACCAAGGCTTCCAAGTGCACGTTCCTTGGCGCTCAGTGCAAAGTATTGACAACTGGTTTCTCGCGACACAGCGACCGTCAGTACGCCGTTTGGGACCAACACGACGTGAGCGAGCCCCTCGCCTCCGAGACCATCGACAGCTCCTCAGGAGTCGTCTTCCCCTACTACGATCACGATACCAACATGGTCTATCTGGCTGGCAAAGGCGACGGCAACATCCGTTACTACGAAGTAGTGGACGAGGCGCCCTACGTGCATTTCCTCAACCAGTTCCTGTCAGGCAACCCTCAGCGTGGTCTGGGCTTCATGCCTAAGCGTGGCGTGAACACATCTATGTGCGAAGTGTTCCGTTTCTACAAGCTGCACACATCCCGTGGCCTCTGCGAGCCCATATCTATGATCGTACCGCGCAAGTCCGACTGCTTCCAGGAGGATTTGTACCCTGACACGGCCGCTCCTCAGCCGGCCCTCTCAGCACGCGACTGGCTCAGCGGAGTAAATGCACCGCCACTACTCATTAGTATGAAAACAGGGGTGACGATATCCACACACAAGCCCCGGAACAACAAGGACGCGCCCGCGCTGCAGCCGCAGGACGCCAACAACAGGAAGAAGTTCGCCTTTCTGTCGCGTGAGACGACCCCCGACTACCGCCCTCTAGCGACGTGGCAGGGCAACCAGGACGATACGCAGCAGGTTCAAGTGACGGAGAAGTGTCAGAAGCAGAACACCAACCAGAACACGAAGTTCCACCAGCTCCAGAGGATGTTCGGCAAACAGGCCGGTGACGTGGAAGTAGTGCCGCTCTACAAACAGATCAACCAGGGAGACGTCTTCAACACGGAGCACGAGCTGCGACTCGCATTCAACCGTCAGGGAGAAGAACTGAGAATAGTAAAACGTCAACTACAGAACAGCCAACAGAGAGTGAGAGAGCTGGAACAACACATCGCCTCGCTACAGTCACGACTCAACACAGCCTAA

Protein sequence:

>DPOGS201048-PA
MPPVKDDLIFNCVEVNIPEKSPGKGTALVDVRACNKPAAKVWFRGVRSSKFRHVYGVPFKRERCYDNIKITRNAHDSNFCAVNPKFVAIVTEVAGGGAFLVLPLDHVKIWHIPDGGLSMHLTDWLVELHGHKRRVAYIEWHPTAENILFSAGFDYLIFVWDVGKGEAVKVIDCHSDVIYCMSFNRDGSLLATTCKDKKLRVIEPRRGIVLSEGPCHLGTKASKCTFLGAQCKVLTTGFSRHSDRQYAVWDQHDVSEPLASETIDSSSGVVFPYYDHDTNMVYLAGKGDGNIRYYEVVDEAPYVHFLNQFLSGNPQRGLGFMPKRGVNTSMCEVFRFYKLHTSRGLCEPISMIVPRKSDCFQEDLYPDTAAPQPALSARDWLSGVNAPPLLISMKTGVTISTHKPRNNKDAPALQPQDANNRKKFAFLSRETTPDYRPLATWQGNQDDTQVQVTEKCQKQNTNQNTKFHQLQRMFGKQAGDVEVVPLYKQINQGDVFNTEHETGRLDFNASRVTGHKGPVLDIKWNPFNDNVIASCSDDCTVKIWHIPDGGLSMHLTDWLVELHGHKRRVAYIEWHPTAENILFSAGFDYLIFVWDVGKGEAVKVIDCHSDVIYCMSFNRDGSLLATTCKDKKLRVIEPRRGIVLSEGPCHLGTKASKCTFLGAQCKVLTTGFSRHSDRQYAVWDQHDVSEPLASETIDSSSGVVFPYYDHDTNMVYLAGKGDGNIRYYEVVDEAPYVHFLNQFLSGNPQRGLGFMPKRGVNTSMCEVFRFYKLHTSRGLCEPISMIVPRKSDCFQEDLYPDTAAPQPALSARDWLSGVNAPPLLISMKTGVTISTHKPRNNKDAPALQPQDANNRKKFAFLSRETTPDYRPLATWQGNQDDTQQVQVTEKCQKQNTNQNTKFHQLQRMFGKQAGDVEVVPLYKQINQGDVFNTEHELRLAFNRQGEELRIVKRQLQNSQQRVRELEQHIASLQSRLNTA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: