MonarchBase - Protein-coding gene

DPOGS202657
Transcript	DPOGS202657-TA	4515 bp
Protein	DPOGS202657-PA	1504 aa
Genomic position	DPSCF300039 - 124255-133544
RNAseq coverage	415x (Rank: top 29%)

Annotation
*Heliconius*	HMEL002229	3e-154	46.65%
*Bombyx*	BGIBMGA000855-TA	0.0	72.84%
*Drosophila*	CG43154-PC	0.0	46.35%
EBI UniRef50	UniRef50_E2BXX0	0.0	54.63%	Breast carcinoma-amplified sequence 3 n=3 Tax=Neoptera RepID=E2BXX0_HARSA
NCBI RefSeq	XP_001603193.1	0.0	54.60%	PREDICTED: similar to breast carcinoma amplified sequence [Nasonia vitripennis]
NCBI nr blastp	gi\|350398685	0.0	54.14%	PREDICTED: hypothetical protein LOC100746524 [Bombus impatiens]
NCBI nr blastx	gi\|383864067	0.0	36.57%	PREDICTED: uncharacterized protein LOC100877372 [Megachile rotundata]

Group
Gene Ontology	GO:0005515	1.4e-07	protein binding
KEGG pathway
InterPro domain	[536-666] IPR022175	7.3e-24	Breast carcinoma amplified sequence 3
	[145-439] IPR011046	1.4e-07	WD40 repeat-like-containing domain
Orthology group	MCL13118		Single-copy universal gene

Nucleotide sequence:

>DPOGS202657-TA
ATGTCGGCGGAGTCTCCGCGGCACGCGCGCTCGGGTGGACCTCTCACGGTGCCCTCCCAGCCGCCCAGCGACCGCAGCATCATTGACGCCGTGTCCGGCTTCATTAATGACGTCACACTCTCCTCTTCATCCACTGTTGATCCAAAGGACGTTATACAGTGGGCTAGGTTTGAAACAGCAGATATAAATGAACCTACACAAGAAGGGGATGGTGATAATGATGTTCCACCATTACTGCTCATCCTGGGCTATGGGTCAGGAGTGCAGGTCTGGTTGATTCCCTCCAATGGGGAGGCGCAGGAGGTACTGTCGTGGAGACAAGGCACTGTGAGGGTGCTCCGTATACTGCCAACTCCGCAGCACGGCGACTGCTTTGCATCGAAAAGGCCCCTCATAGCTTTGTGTGATTCTGCCAGTCCAGGACCAGCCTTTTGTTCATTGATCTTCTTATCCATTAGGGGTGGGGAGCAGGTGAAGAGTATTAAGTTCAAGAACCCCATCCTGGATGTGTTGGCCAATAAGCGTTCAGTGGTTGTGTCATTCTCTGAACGTTTTGCTGTTTTTGATGCTGCTACTTTAGAGGACCGGCTGGCTGTCACCACATGTTATCCGTGCCCATGTCCACTAGGAGGGAGCGCTCCTATCAACCCTTTGACCCTCGGGGACCGCTGGCTGGCTTATGCTGAGAAGAAACTCAACCCATCAAAACGTAGCAGCGGAGGATGTGAAACTGAAGGGGTAACGAGTTATACGGCTACTGTACTCCACGCGGCTAAATCTCTCAGTAAGGGTCTGCGAGGCCTGGGCGAGACGGTGGCGCATAGTTTGGCGGGCGGTCGCAGCACGTCGCAGTCACCGTCACCACCACACGCTGATATACAGCAGCCGGGGGTCGTCACTATATTGGACATCGAGGGTAATGAAGATGAAGATAGTCAAGACTGCGAGGAGCCCTGCGACCCTATAGTGGCTCACTTCATCGCTCACTCGGAGGCGATTATAGCTCTGAAGTTCGACCCCAGCGGCATGTTGCTGGTGACCGCCGATCGGAGAGGTCACGACTTCCACGTGTTCCGTATAAACCCCCACCCCTGCGGACCCAGCCTGGCCTCCGTGCACCACCTGTATATACTACACAGAGGCGATACTACGTCCAAAGTACAGGATATATGTATATCCGGTGACTCCCGTTGGGCGGCCATATCGACCCTCCGGGGTACGACGCACGTGTTCGCGATCAGTCCCTACGGCGGGGCGATCGGCGTCCGCACTCACACCCAGCCGCGGCTGGTGAACAGACTGAGCCGGTTCCATCGCTCGGCCGGCCTGCCCATACATCATACATCCCACGTCCCGCCCGCCGCTCACAGCCCAGTTCTAGAGTCCGGGGCGTGGTTTCCCAACCCGCGTCTCCCGCCGTACCCGCAGCCCGCGACTTGTTCGCCCCTGGCGCAGCTGAGACCCACACACCTGCCCACCACCACCATCACAAGGAACAGCTCGGGTCGTCAGCGTCTGTCATCGTTGTCTGAAGAGGGCGGCGCGGCGCCCCTGTTAGCGCGGGCCTGTTTCGGTGTGAGCGGCTCGACTGGCAGGGCCGCCTCTGTGCCGCTCTACCTTGCAGCAGCTAACGGGGCATTGCTGCATCTGGCTCTACATCCCAAACCGGCCCGCAGTGTTCCCAAGGAGAAGATATGTGACGAGTCTCCCATCGAGCTGGAGGTTGAGGCGGTGTCACAGTGGCCTCTACAGCGTCCTGCCGCCGCCTCCGACCTCCTCGCCCCACTCCCTCCCTCCAACCCCCTCTTACAACCCATGAGCTGTAGGCGTTGCGCGGACATATGTATGAGTGAAGAGGAGCGCTGGCTGTCTCAGGTTGAGATCGTGACGCACGCCGGCCCGCATCGCAGACTGTGGATGGGACCGCAGTTCGTCTTCAAGACATACAACTGTACGGGGTCTACGTCATCACTATCAGAGGCAGAGGCGGTGGAGGTGGACGCCAGCGCAGCCCCGGCCCGCTCCAACCCCGTCAACATGCCAGGGGCGAGGCCAGCTGTGCCCGTCCTAATAGACTCCGGATCAGCCAGTTCCCTGGAACACTCTCCGTCTGACAGTTTCCGTCGCAAGTCGCTGCTGGAGCCGGGGCGAGTGTGCGACGTCCAGCTCAGAGAGGACCTCGCTGAGGCCATGAAGGAGGATCACGGGTTGCCGCGGGTGGAGCGCGCCTGCAGTGTGGAGCGCGGGGGAGCGGTCGTGGCCCGAGATGTCGGGCCGACCGGGGCCGTGGCCGCGCATCGCGAGGAGCCGCACGCGCCAGCCCTGGACGCGGACGCGCACACGACCTGCAATACTGACGAAGCGGCCTTCCGACCTGTAGTGCGTGCGCCGGCGACCCTGAGCCCGCTGACACCGGCGCTCTCAGCTCGAGAGCTTCCTTGTTGTACCACCATCCCAGCGCAGCCCGCGCCTCCGCGGCGAGCCTCGCCGGACGACAACCCGTTGCCTCTCACCACAGACGTCGTCATACCGGCCGAACTGACCGACGGTCGCCTCGAGTTCACTCATCTGCCGGCCGCGGAGCCCATTACTGATACGATCGGCGGGTTTGATTCCTTCGCAGACTTAGATGTTAAGAATACATTTGTACATAGAGATCTCGATTACAGTGAGCGAATGGAGAGTGAGAGAATGAACGATAGAGCCCCGGCACCGGACAAGAGTGATGAGGTGCCGAGTTCACTGCCAAAACCGAAACGGCCATCGGATGATATTCAACCGTCGGCTCGACCTAGAGTTAAGAAATCTCCCACCACAAAAACGCATAGTGATAGAGCAGCTAGTGATATAGATAAATTATGTGTGAATGATAAAGATTTTATGAATATACACAATGATGATATGTCTTCTAAACTCCGAGCAGCGGAGAAAGAAATTAAACCTCAGAAAGGAATGAAAGTGTCTAAAGGAATTGAAAAGCAGAATCAACAGGGTATTTCAAAAAACGATAAAGATATAACCCAGTCGCCAGAACCTAATGTGAGAGAGACCACCACGAAGTATGAAAAACATTCAGAAACGATTAGAACAGAAGATCAAGCTTGGGATATGCTTTTAAACGATACACAACAAACTTCTAAGAAAGACGTAAATCTTGTTACCGCAAACAAAGTGGAGATAAAAGATGACGTGAAAGCAAAAACTAAGAAAAGTCGTAAATCTAAAAAATCTATAGAAGATCAACAAGCCAAGGACGACGAAGACAGCTTTATAGAAATACATAATATAGAAGAGAAGCAAACGACCAGCGGAGATCTAGTTTCTATATCAATGCCTTTTGAGGACATTGAATCTTCTTACTTGCCGAAATCTAAGAGACGTTCAAAGAGCCGCACACCCGAGAGAAAAGATGTCGCCGAAAATAAACAAGAAAATATCAACGAACAAGATTTTGATATTCCAAACATTAGTAAGAAAAATAATAAAATGAATGAAATATTGACTACAGAATCTAAAACACAGCCGATTTCTTTGTCTACTACAAAGGATATAGATAGTAAACAGAAAGAATTATTAAATGTTGATGCTAAAACTGGTAACGAACCTAAGGCTGGCAAATCACTATCGACCAAAGAATCACCAAAATTAACAAAGCGCAAGTCCCCGTCACCGAAAGTTGATAGAAAAGAAGAAAACAAAGCTGACGATAAAGAAGTTTATGTCATTGAAACAACAGACGACGACTTTCCCGAAATACAAATAACGAAGGGGAATAAATCGAATAAGAGGTCTTTTCAACTTTATGAGAAGAAGAAAGAAGAAGCAGCGAAACCGGCTAAATCTTGGAGTTCCGTAGCTGCTTCTAAAAATAAAAAGGTCGACGAAGTCAAAGTTGTTACGGAAAATATTGAAGAACAAGAAACGGAAGACGAGGAAATGAAATCACCAGTATCGCTTCAAGAAAAGTTATTTGAATTGTGCAAAAGAAGAGACATAATGGTAGCTGAGTGCGATGCTCCATCAGAACTTAATTTTGTCGAGGAACATCATGCTGTGGTAGACCTCCCTCCTTTAGAGCAACTAGATTTCGGTCTAGACAACTTCTCACTGGAGGTCATGCGGGACAGTCTTCTGGAAGTCAACGAGCCGAAGGTCTCCAGTCCGATTTGCAAAATCAACATCGATGAAATCCTGTCTTCCATCAAAGAAACGACATCGAAAGCGATCGAAACCAGTACTTTCAATCTAATTGATGTCGAAAAAGTGCCTGCGAGGAAAGAAAGGGGCTTCAATATAGTCGAAAGCGATAAAATTACGTCCCAAGAAGTCAAATTGGAGGATGAGGTCAAGTTCGAGAAGGACGAACTTGAAAAATCATCTGACGAGGAGATGGCATCACCAGTTCTGTCGACTGACAGCGATAAAGAAGAAAAAAAATCAAGCGAAAACAGTAACGCGACCCCGACAGCGAAGCAATCTAAGTCTAAAAAGTCACGTAGGAAGAAGAAATTATAG

Protein sequence:

>DPOGS202657-PA
MSAESPRHARSGGPLTVPSQPPSDRSIIDAVSGFINDVTLSSSSTVDPKDVIQWARFETADINEPTQEGDGDNDVPPLLLILGYGSGVQVWLIPSNGEAQEVLSWRQGTVRVLRILPTPQHGDCFASKRPLIALCDSASPGPAFCSLIFLSIRGGEQVKSIKFKNPILDVLANKRSVVVSFSERFAVFDAATLEDRLAVTTCYPCPCPLGGSAPINPLTLGDRWLAYAEKKLNPSKRSSGGCETEGVTSYTATVLHAAKSLSKGLRGLGETVAHSLAGGRSTSQSPSPPHADIQQPGVVTILDIEGNEDEDSQDCEEPCDPIVAHFIAHSEAIIALKFDPSGMLLVTADRRGHDFHVFRINPHPCGPSLASVHHLYILHRGDTTSKVQDICISGDSRWAAISTLRGTTHVFAISPYGGAIGVRTHTQPRLVNRLSRFHRSAGLPIHHTSHVPPAAHSPVLESGAWFPNPRLPPYPQPATCSPLAQLRPTHLPTTTITRNSSGRQRLSSLSEEGGAAPLLARACFGVSGSTGRAASVPLYLAAANGALLHLALHPKPARSVPKEKICDESPIELEVEAVSQWPLQRPAAASDLLAPLPPSNPLLQPMSCRRCADICMSEEERWLSQVEIVTHAGPHRRLWMGPQFVFKTYNCTGSTSSLSEAEAVEVDASAAPARSNPVNMPGARPAVPVLIDSGSASSLEHSPSDSFRRKSLLEPGRVCDVQLREDLAEAMKEDHGLPRVERACSVERGGAVVARDVGPTGAVAAHREEPHAPALDADAHTTCNTDEAAFRPVVRAPATLSPLTPALSARELPCCTTIPAQPAPPRRASPDDNPLPLTTDVVIPAELTDGRLEFTHLPAAEPITDTIGGFDSFADLDVKNTFVHRDLDYSERMESERMNDRAPAPDKSDEVPSSLPKPKRPSDDIQPSARPRVKKSPTTKTHSDRAASDIDKLCVNDKDFMNIHNDDMSSKLRAAEKEIKPQKGMKVSKGIEKQNQQGISKNDKDITQSPEPNVRETTTKYEKHSETIRTEDQAWDMLLNDTQQTSKKDVNLVTANKVEIKDDVKAKTKKSRKSKKSIEDQQAKDDEDSFIEIHNIEEKQTTSGDLVSISMPFEDIESSYLPKSKRRSKSRTPERKDVAENKQENINEQDFDIPNISKKNNKMNEILTTESKTQPISLSTTKDIDSKQKELLNVDAKTGNEPKAGKSLSTKESPKLTKRKSPSPKVDRKEENKADDKEVYVIETTDDDFPEIQITKGNKSNKRSFQLYEKKKEEAAKPAKSWSSVAASKNKKVDEVKVVTENIEEQETEDEEMKSPVSLQEKLFELCKRRDIMVAECDAPSELNFVEEHHAVVDLPPLEQLDFGLDNFSLEVMRDSLLEVNEPKVSSPICKINIDEILSSIKETTSKAIETSTFNLIDVEKVPARKERGFNIVESDKITSQEVKLEDEVKFEKDELEKSSDEEMASPVLSTDSDKEEKKSSENSNATPTAKQSKSKKSRRKKKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: