MonarchBase - Protein-coding gene

DPOGS207452
Transcript	DPOGS207452-TA	5607 bp
Protein	DPOGS207452-PA	1868 aa
Genomic position	DPSCF300051 - 304322-324497
RNAseq coverage	131x (Rank: top 56%)

Annotation
*Heliconius*	HMEL014848	88.46%
*Bombyx*	BGIBMGA001194-TA	75.87%
*Drosophila*	rab3-GEF-PD	69.47%
EBI UniRef50	UniRef50_D2A2D7	58.60%	Putative uncharacterized protein GLEAN_07834 n=1 Tax=Tribolium castaneum RepID=D2A2D7_TRICA
NCBI RefSeq	XP_975086.2	57.59%	PREDICTED: similar to rab3-GEF CG5627-PB [Tribolium castaneum]
NCBI nr blastp	gi\|270005730	58.60%	hypothetical protein TcasGA2_TC007834 [Tribolium castaneum]
NCBI nr blastx	gi\|270005730	56.20%	hypothetical protein TcasGA2_TC007834 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[82-323] IPR001194	1.3e-47	DENN
	[9-106] IPR005113	6.5e-24	uDENN
	[442-512] IPR005112	5.5e-15	dDENN
Orthology group	MCL16050		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207452-TA
ATGGACGTCCAAAAACAGCAACTTTGTCCGCGACTTGTGGACTATTTAACAATAGTTGGTGCAAAACCGTACACTACTGGGAAAGGACTAGCCCCGGTGCAGGCGCCAGAACTACTTCGTCGTTATCCCCTAACCAACCATGATGACTTCCCTCTACCGCTGGATATGGTGTATTTCTGCCAGCCAGAAGGTTGCGTGTCTGTGGGGCCTCGGCGCCAACTTGCACATATCGCAACACGGGACACAACCTCCTTCGTATTTACACTTACAGATAAAGATTCGGGTAAGACCCGATATGGCATCTGCATCAATTTTTACCGCGCGATGGAGCGTGCACCGACACCTGGTCCCCGGGAGAGAAGTGTTTTGCGACGCGAGTCTTGGAGGAAGTCTATGGAGAGGAGTTCAGACTCCGCTTTCTCGAGAGATACAGTGTGGTCAGTGCTCACTGGCCAGGCGTACGATAATACGCCGACAATAGTAGTGCATGACGTTAAAGAGATTGAGACGTGGATACTACGATTGCTGTCAGCTCCCGTACCAGTTCCAGGGAAAACTCGACTCGAACTCGAAGTACTCTCACCAACAGCACACGCACCACTGGTATTTGCATTACCTGATCACACAAGATTCACTCTTGTTGACTTCCCTCTACATCTACCATTGGAATTGCTAGGTGTTGATACTTGCTTGAGAGTCTTAACCTTGATAATGCTGGAAAACAAAGTGGTAGTTCAATCGAGGGACTATAACGCGCTCTCAATGTCGGTGATGGCGTTGGTAGCGATGCTGTATCCACTAGAGTACATGTTCCCAGCGATACCACTATTACCGAGTTGTATGAGTTGTGCGGAACAATTACTTCTCGCTCCAACTCCATTCCTAATAGGAATACCCGCTACATTCTTAACATACAAGAAGAATTTTAAATTACCAGATGACATTTGGTTAGTAGACCTGGACGCTACTAAGCTTAGTGGGCCTTACGGTAACGAACAGGACCTACCTCCTCTGCCAGAACCAGAGAGTTCAGTCCTTAAAAACCATCTAAAACAGGCACTTAGCAGCTTAACAAATAGTTCAGCAGAACAAGCTGCAGCGCCTCTTCTACCTTCGAGAAGAGATAGTGTTGGTGGGGCTACATTAAAGGTACAACCAGCGACCTTCCGTGAAGGGTCTCATAGTACCCCAGAGAGTCGACGTGTGTCTGTGGGCAGCGCACACACAAGACTGTCGCTCGCGTCGCCACACTCACCGGCACCTCAGAGCTCTCCACAGGCACAACCGTTCAACCCTTTGATATACGGCAACGACGTAGATTCCGTCGACATCGCTACAAGAGTCGCTATGGTTCGTTTCTTCAATTCTCAAAATATTTTGGCGAATTTTATGGAGCACACTCGAACACTGCGTTTGTATCCACGACCCGTCGTAGCTTTTCAGATCAATAGCTTCTTGCGATCAAGACCTCGATCTTCTTCTTTCTTGAATAAATTCGCTAGAACACAAGCTGTAGAGTTCTTAGCAGAGTGGTCTTTGACACCATGCAATGTTGCTTTCCTAAGAGTACAAACAGGTGTGTTTGATCCTCGACAAATTGGTGATAAACCAAAATGGTTTGCGGACCAACTGCAGCCCATACGATTCGCAGTTTGGGATGACGGCAGTTCACTAAACGGTGCCTTGAGACAGTTGCAAAGACAGGAGAATCAACCAACAGATGAGAGCGGATCTGATTCTGAAGCTGCTGAGAGCACTAGTTCATCATATTCATCTTTAAGCGACTTCGTTTCGGAGATGGCCTCATCAGATTTATCACCAGGTGGAAACGTTCAACAGCACGTTATTGGCGAAACTTATAGTGCTGTAGTACAGGTTCCTATGACACTCTCTTCATCGTTAGATCCGAAAACGGTATACAGTCCACCATCTTCGCTAATATTTGGAGAAGAAGGAGAAAGAGAAGGCCAGCGAGACGGACGGGAGTCCACTTCTCCTTCCCCATCAGCTTCTAGTTCAGATCACAGCGACTTGTCTGATGATGACATCCCTGGAACTATGAACCGTCCCGACATCACCGATCAACCAACACCAGTCAAAAAAAGTGACACAGATAGTGGTAGCTTGGGACGAGAGTCGGACTCATCAACGACTCCTGCGACAGTCGCGTCGCGTCGTCCACGTGATCCTGACCCTGTGCGAGCTTCTCCACATTCCCGCCCTAGGAGTTCTAACAGTGGTGTATCAAGACAAGCGTCGCAAACGTCACTATTAGAACAATTTGCTGCTCAGGCGAAGGAGCTTGTGCGAGAGACCACTCGTCAGAGCAGTCAGGAGGGAATATTAGCGCATATGGACAAAAACGGGAAAGCTGATCAAGGACAAGATAAGAACATATTTGCTCCTTTCGATAAGTTAACCCTTCATGCAAAAAAAGCCGCAGAAGAGGCATCGAAGAGTGTTCAAGAGGCGTCGAAGTCAGCATTAGAAGCGAGTAAAACGGCTACAGCAGTCAGCAAAAACACGTTCGAAGATCTTACTTATGTGGGAAAGTCTACTTTAGGAGATCTTACGAAAAGTGCCAAAGAAGCTGCAGCTAAGAAAGGCTTGTTGAAGGGTGAAAGTCAGGATGCTTCTACTAGTTCCAATGCAAGGAGGGATTCGACAGCGCTGCAGACGACTAACTTACTTGCTACCACACATCGTGACTTCTTTTCCAATATTAGTTCTGACTTAAACGGTCTTGCTGCTTCAACTACTAGTATGTTCAGTGACTTCTTTGGTTCCGCTAAAGGAAAGCAATCAAAACCTGAACCGTCCCCGAATACTCCAATGACAGCAACATTTGGTCCTTTCTCTCAAGGTGCCAAAGGTTTAGTACAGCGCTCGCCACTTATTCGCCATTCTTCTCCAGCACCCGTCGCACCACCAATAAATACGAGATCTACTAATAGCGAAAATCAAGCGTTCCTGAATGATCTTGTACAACACGTTCTTGAAGGAGAAGGCGTTGGATGGCTTAAACTAAATCGTTTAAAGAAGCTAATGGAAGACGAATCATACAGGAACATGGTTCTTAGTAAACTTAATAGAAACTTTAATAGAAAGACTTCACCGAATGATAAAGTGGATGACGTGTTTATAAGCAAACCCGTATGGAAAGGCATGCTAAAAGTACTTCAGGCTGTGGTTCATGGCTTAGAACATACGTATTCCAATTTCGGGCTTGGGGGAATGGCTTCCGTTTTCCAATTAGCCGAAATGGCACACACTCACTATTGGAGTAAAGAATTCGCGGGATTAGAACATGGAGGTATGGCTGGTTCTGCACTATCTGAACATTATGGAAGGCAAGATTACGAGACTCCATTGTCAACGCCGTCTTCCAGAAAGAGCTCGCAGTCCGATGCACCCGTTGTCAATTACCCAGAACAAGAACACGGTGACACTCAGAGTACAACAGAAATCTTCAAGGATATGTTAAATCAAAAACGAAACCTTTTATTTAGCAAGTTGACTTCTTTTGATTCCGATGCCGCGTCATCGGAGTGTTCAGACAGCGGGTCCATTACCACCAATCGCGCGCTCGCCGATCACCGCGCTTCCTTTAAATCAAATCTCTCTGACACTGACGTCATGTTCCTTAATGTTGGTCGACCAGGTGTCAAGGGACGCACCGGTAGTGTATTCTCGACCAAATCTTCTGTTAATGGTAGACCGATGGCCGGAGTACCTACCACCTCACCACTTACCTCTCCTGAAACCGTCCGCACTTATCTATTTCAAGGATTAATAGGGAAAGAGAGATCGAACTTATGGGACCAAATGCAGTTCTGGGAAGATTCATTCTTAGATGCGGTGAGTCAAGAAAGAGATATGATTGGAATGGACCAAGGAGCGAACGAAATGATGGAACGATATAAATGTCTCAGCGAAACGGAACGTAAACGCTTGGAGCACGAGGAAGACAGGCTGCTGTCTACTGCTCTATATAATTTAACTGCCGCGATGGTAATGCTTGGAGTTGAAGCGGACATTATTAGGAATAAAGTAAGACGATTGCTGGCAAAAAGTCATATCGGACTTGTTTATAGCCAAGAAGTCAACCACCTGTTAGATGTTGTCCATAATCTGCATGGAAATGATATAAGTCTTAAGGCTCTTGGATCTCGAGCCACACATCGCGCCACGTTCACAGTCCATGAGCGAGATGCAACTGGAGCTTTACGCTTCTTGGACGTAAGACATGATGGACTCGTTCTAAGAACAACTCAAGGGACCATTGTCGAGAGGTGGTGGTACGAACGTCTCGTGAATATGACGTACAGTCCGAAAATACGAGTATTGTGCCTTTGGAGAAAAAATGGTGGACAGACGCAACTTCATAAATATTATACCAAAAAGTGCAAAGCGCTATACTACTGCATCAAGGAGGCGATGGAGAAAAGCGGAAGGCGACAAGATGCAGCGGAACTGGGCGGGGAATTCCCTGTACAGGATTGTGCTACTGGCGAGGGTGGTCTTATACAGGTGTGCATGGAAGGCGTCGGACTCCTGTTCCACCATAGCAAGTTCTTCGTGCGGCTCGATCACATTCGGAAGTGCTTCACGCAGAATGGGGGTATCTTTGTTTTAGAAGAATTTAATCCTAAAACCAGGCAGATAATTCAAAGAAAATATAAATCTATAATGGTAAGCAGACAAAGTAGTGCTTGCCCTTCATCGTTTCTTCTCAATATGGCTTACTCGGTACTATCTCGTTGTCGAAGTCAATGGAATCCATCCGAATTGCGCACCTTACGTTTCATAATTCACTCTAATGCGGATCAAATATGCTATGCGGTGTTGTGCGTCTTCTCGTACTTCGCGGCTGGGCAGGAACAGAAAAAAGCTATATTGGAGCAAGCGGCACAGATCCATGCACCTGAAGCAACCACGAAAGCTCCGTTGTCCCCAAGAAACGACGATGAAGTGTTCCAGAGCAAGCCTAGCCCACAGAATACAAGAAAGGCATCGGAGGTCCGTGTGAGCGAAACCGAAAGACAGAGGGTGCCACCGGACAAGCCGCGTATTCTACCCGAGCGGCCGAAGCAGCTGATCGAACCAGAACGAGAACCTGCGAATGATGGTTCAGATAGTAAAACAAAAGAGACAGGTAGAAGGGATAGTGAGGGAAGCTCGGAGAGAGAAAGAGACAGCACACGTCCAGCTGCCCAAAGAACGGACAGCTTACCACCACGACGGCCGCCACCACCAGTGTTACCACCGCAGAGACTGGTGCGAGCTTACTCGCAGGCCTCACCCAGACATCACGAACCGCCCTCGATCCCTCCCCGAGTCGGAGTCACCCCACGTGCCGGTCCGCCACCCGCACTACCTCCGAGACAGATGTCGGCAGCTGATGCTAGTGCTAGCCCCAGACATTCAGCGACATCTAGCCCAGTGCGTCGTGAAGGCCTGGCCCGTCAGAGCTCGATTAGTGCATCACCCGCCAGCACAGTTGCCTCCGCCCCATTTTCATCCACTAACCCCTTCACCGCAACTCGACACACAGAATTCGTTATACCGCAACGAGGTTCCCGTCGCCCATCTACCGACCGCAATTAA

Protein sequence:

>DPOGS207452-PA
MDVQKQQLCPRLVDYLTIVGAKPYTTGKGLAPVQAPELLRRYPLTNHDDFPLPLDMVYFCQPEGCVSVGPRRQLAHIATRDTTSFVFTLTDKDSGKTRYGICINFYRAMERAPTPGPRERSVLRRESWRKSMERSSDSAFSRDTVWSVLTGQAYDNTPTIVVHDVKEIETWILRLLSAPVPVPGKTRLELEVLSPTAHAPLVFALPDHTRFTLVDFPLHLPLELLGVDTCLRVLTLIMLENKVVVQSRDYNALSMSVMALVAMLYPLEYMFPAIPLLPSCMSCAEQLLLAPTPFLIGIPATFLTYKKNFKLPDDIWLVDLDATKLSGPYGNEQDLPPLPEPESSVLKNHLKQALSSLTNSSAEQAAAPLLPSRRDSVGGATLKVQPATFREGSHSTPESRRVSVGSAHTRLSLASPHSPAPQSSPQAQPFNPLIYGNDVDSVDIATRVAMVRFFNSQNILANFMEHTRTLRLYPRPVVAFQINSFLRSRPRSSSFLNKFARTQAVEFLAEWSLTPCNVAFLRVQTGVFDPRQIGDKPKWFADQLQPIRFAVWDDGSSLNGALRQLQRQENQPTDESGSDSEAAESTSSSYSSLSDFVSEMASSDLSPGGNVQQHVIGETYSAVVQVPMTLSSSLDPKTVYSPPSSLIFGEEGEREGQRDGRESTSPSPSASSSDHSDLSDDDIPGTMNRPDITDQPTPVKKSDTDSGSLGRESDSSTTPATVASRRPRDPDPVRASPHSRPRSSNSGVSRQASQTSLLEQFAAQAKELVRETTRQSSQEGILAHMDKNGKADQGQDKNIFAPFDKLTLHAKKAAEEASKSVQEASKSALEASKTATAVSKNTFEDLTYVGKSTLGDLTKSAKEAAAKKGLLKGESQDASTSSNARRDSTALQTTNLLATTHRDFFSNISSDLNGLAASTTSMFSDFFGSAKGKQSKPEPSPNTPMTATFGPFSQGAKGLVQRSPLIRHSSPAPVAPPINTRSTNSENQAFLNDLVQHVLEGEGVGWLKLNRLKKLMEDESYRNMVLSKLNRNFNRKTSPNDKVDDVFISKPVWKGMLKVLQAVVHGLEHTYSNFGLGGMASVFQLAEMAHTHYWSKEFAGLEHGGMAGSALSEHYGRQDYETPLSTPSSRKSSQSDAPVVNYPEQEHGDTQSTTEIFKDMLNQKRNLLFSKLTSFDSDAASSECSDSGSITTNRALADHRASFKSNLSDTDVMFLNVGRPGVKGRTGSVFSTKSSVNGRPMAGVPTTSPLTSPETVRTYLFQGLIGKERSNLWDQMQFWEDSFLDAVSQERDMIGMDQGANEMMERYKCLSETERKRLEHEEDRLLSTALYNLTAAMVMLGVEADIIRNKVRRLLAKSHIGLVYSQEVNHLLDVVHNLHGNDISLKALGSRATHRATFTVHERDATGALRFLDVRHDGLVLRTTQGTIVERWWYERLVNMTYSPKIRVLCLWRKNGGQTQLHKYYTKKCKALYYCIKEAMEKSGRRQDAAELGGEFPVQDCATGEGGLIQVCMEGVGLLFHHSKFFVRLDHIRKCFTQNGGIFVLEEFNPKTRQIIQRKYKSIMVSRQSSACPSSFLLNMAYSVLSRCRSQWNPSELRTLRFIIHSNADQICYAVLCVFSYFAAGQEQKKAILEQAAQIHAPEATTKAPLSPRNDDEVFQSKPSPQNTRKASEVRVSETERQRVPPDKPRILPERPKQLIEPEREPANDGSDSKTKETGRRDSEGSSERERDSTRPAAQRTDSLPPRRPPPPVLPPQRLVRAYSQASPRHHEPPSIPPRVGVTPRAGPPPALPPRQMSAADASASPRHSATSSPVRREGLARQSSISASPASTVASAPFSSTNPFTATRHTEFVIPQRGSRRPSTDRN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: