MonarchBase - Protein-coding gene

DPOGS207340
Transcript	DPOGS207340-TA	3477 bp
Protein	DPOGS207340-PA	1158 aa
Genomic position	DPSCF300188 + 126966-135144
RNAseq coverage	208x (Rank: top 46%)

Annotation
*Heliconius*	HMEL002204	82.15%
*Bombyx*	BGIBMGA010268-TA	74.91%
*Drosophila*	SIDL-PA	37.61%
EBI UniRef50	UniRef50_E2B8E7	46.41%	Trafficking protein particle complex subunit 10 n=9 Tax=Formicidae RepID=E2B8E7_HARSA
NCBI RefSeq	XP_623870.1	47.12%	PREDICTED: similar to CG6623-PA [Apis mellifera]
NCBI nr blastp	gi\|322785404	46.80%	hypothetical protein SINV_09205 [Solenopsis invicta]
NCBI nr blastx	gi\|307188113	46.77%	Trafficking protein particle complex subunit 10 [Camponotus floridanus]

Group
KEGG pathway
InterPro domain	[991-1148] IPR022233	3e-22	Trafficking protein particle complex subunit 10
	[454-542] IPR021773	7.3e-07	Foie gras liver health family 1
Orthology group	MCL11875		Single-copy universal gene

Nucleotide sequence:

>DPOGS207340-TA
ATGAAGGGGGTCGATAACTCATTATCGGATCACGAAGGCATGACACACAAACCCATTATAACATGTGCAGGAGATTGGAATTTATTTTGCACACTGGAACAGCCGCTGGTAGCTGCAATACCGCAAGATTCTTGTGAATGGCGAAGGTCCTACGGCCGTATAACTAAACTAGTGTCTTTAGAGGCATCTTTCATAAAGTTTAATAAGGACAAATTGAAAACAGAGCTCAACCTTTTGAACCGACCTATTTTTCACATTTATTGGACTGATTGTGTGGATATAGAATATTACAAAACCACATTGAGGGAAGATATAGAAATATGGCTGAAACAGTTAGAAAAACACAATGTTACAGACTGGATGATAGTATTAGTAGAAACTTATGATATAAGAAAAACAAATAAACTTCTTCCAAGAACTACAGTTTTAGATAAAATTAAGGGAGATTTTGCTGTGAAACAGACAGAAGACAGGTTTATTTCGGTTATCAATCCTATAAAATCTGAGGCTAGGAGTGCGGACTCATGGAGAACATTAGTGGCGAAAGTGAGGCATCTGGTTTTAGTGGCATACAATAAGGCTCTAATAAAATTTGAAGAGCATATGAGGGAACAGAGAGAAAGCAGGAATGATCCGGAATGGGATTTTTGTAAATATTTTATATTACAGGAGCAATTGGCGTTTGTTCTAGAGATGCTCGGTTTGTATGAAGAAGCTCTAGTCCAATATGACGAATTAGATGCTTTGTTTTCTCAATTTGTATTAAATTCAAACGTGACGGAGAGTCCAAAATGGCTTGAGACATTCAAACAGCCAATAACATCATGGCAGGCGGTGAGATTGACGGCCCTAGTGCCGCAGAATTTAAGAGAATTAATAATTAAGAATAAAGCATCTCTATTAGATTTTAGGAGTTATTTATTTCAACGACAAAGTGCCATGTTATTACCTACTTTTAAGCCATGGGAGATAGCATCCCGATGTCTCACCACGGTCCATAATACACTGGTTGAGGTGTCTCTGCTAGGAGCACATGCTGTGGATGGAGCGGCGGCTTGCTGGGCTCACTTGGCCTGTGTGGAGACATTAAGAGCATGTGAAAGATTGTCCTCCACCAACAGTGCGCTGGAGGCGTGCACAGCAATGCATGCACCTCTGCTGCATAATGCTAAAGATAAGTTACATGAATTGGGCAAGTTGTGTGGACTCCTCCCAGGATGTCCAGACCCTACATCAGAACAACTCCACTTGGTGGTGATGCTGTCAGCTGGTATGGGAGATAGCGAACCGAACCAACAAACACCAACAGACAGATTGAAAGAAGCTTTATGCAGCAAGATCTGCTTCCAGAATTATTATCTAGAATTGGCTGAGTTGGCTATGGGGACATACAAGCACATTGGAAGACTTAGATTCGCCCGTCAGATCGGAAGAGACCTGGCCTCGTTCTACTCGGAACTGGGTGAGAGCAGTAAAGCTGTGGTGTTCCTGACGGAGGCGCTTCGGTCTTATGAAGAACAGGGCTGGAGAGATCTGGCAGCGCAGACGAGGCTCGAGCTGGTGGCTGCGGCTTGCAAGATGAAGGATAGAGATAGATATACAAAGCTCTCAGCTAGAATAGCCAGCACAGCGGAATTAGAAATTCTAGTACGGAATTTCTATTTTGAGGAAATGATGAAATCTATAAAGGAAACTGATAAACAGGAATCAGTGTTAACCGAGCTCAATGACTGCTTTAAAATAGTATCAGTTAATATACTGCCGTCCGAACGTGGTGTCTACATCACAGATAATAAGGTTCAATGTCGCTTGGTGATCGAAAGCTTGATGCCCAAAGATGTTTTATGCAACAAAGCGGCTATATGTGTTGATAGTGTGAAGCAAGATAAGACTCCAGTGAAGACTTATAAGACTGATCTAACTGTAGGCAAACAATCTAGTTCACCGAGGAAATCTAATATTGATAATACTGATAGTGATTCCAATAATTTAGTTACTAGTATAAGACTAGAAGATTTAAAAGCAAAAAATTCATTCCTTAACAAAATGAACATAACGTCTAAATTGCATTACAAAGAAGACAGGACACTACAGAAGGCTACCGTCGAATGCTCTCACCCAAAAGTAACTTTAAGGAGATCAGACAGCAGTAAATATAGAAAACCGTCTGCTACAATACGGAATAACTACGAGACGTGTTTAGCAACTGACCATATTATTTTGAAACCCGGTTTAAATGAAATATTACTGGAATATGTACCAAAGATGTGTGGTTTATTCAAATTGGGACAAGTTTCGTTGTTAATTGAGGGTAGACTTGAATTTCTATCGAATGCATTGATACAGTGCAAGCTTGGTTATGACGTGGAGACGAGAGGTGTCAGCGTGTACTTGAACAAAGTCGAACCAAAAAAGGATTTGGTTGCCGGCTTAGAGGAAGATGTTGAATTGGTTGTGACCAGCGGCAGTTCTAGAATAGAAGAGAATTCAATAATTCAGTTAAAAACATCGACCGGACTCCAAATACGTTTCACAGATTCGAATCTGTCAAGAGAGTTGTCTATGCCAATAGAGTCTATAGAGCCGTTCCAAACGACCAAAGTAGGGCTCAAGTTGTTTGCTAATCTTCAACCTAGAAGGGAAAAAAGTATAGAACATACTGTTTGGCTCCACTGTCCGTGGTGGGAGACCGTGACGGAGGTGCCCTTACACTTTACACCGCCCATGATAGCCTCCTGGAGGTTACTGACTTCCAACACCAGGAAGTTCATTCATATCACCCTCAAATCAACCATCGTGCATCTCGCTCAGTTCGTGCTGAGTGATCCTGTGCTAGAGTGTGACAATGATAATACTGTGGCGGATTTGAATCCAAAGAACGCTGGGGATATGATAGTAGCGTCCGATGGCACCACCAGCTCGTTCATGTGGGAGCTGCTTAAGGATCCTCTGGTGAAGGCTGGGCCGATGAAGGCGGTGTTCAAGGTCAACTATAGATTACTTGAAGAAGATATATCCAGACAATTTACTTGCCCTTTTGATATACAAGACTATACCACTCTTTTTGTTGTGAGAACTAAGTTGGAGCCATCCAAGGGTTCTGACTTCTGTAGAGCTTCACAAGTCTGCTGTTTACAGTTGACTGTTCAAAGGGTAAATGAAACAGAGCACACTTCTCTAATGTATGAAGTGCTTGCGGATCAAACCATGTGGGCGGTGCTGGGACGAACTGCGGGTGTTATAACAATGGAGTCCAATTCTGAAGGTCAATGCGTGAACCTGGATGTGATGCCACTGGTGGCTGGATACCTTCCACTACCAGCTGTCAGGTTGTCGAAATACATCGCTGCTAACACTAGAGACCCTTCCTCCCATCCAAGATTGGAGCCGTTCAGTCCTGGCCAGGTGTACCACGCGGGGAAGGCAAGACAGTTACACGTTCTACCACCCCTCACCAAAGAACATGATAATATCTGA

Protein sequence:

>DPOGS207340-PA
MKGVDNSLSDHEGMTHKPIITCAGDWNLFCTLEQPLVAAIPQDSCEWRRSYGRITKLVSLEASFIKFNKDKLKTELNLLNRPIFHIYWTDCVDIEYYKTTLREDIEIWLKQLEKHNVTDWMIVLVETYDIRKTNKLLPRTTVLDKIKGDFAVKQTEDRFISVINPIKSEARSADSWRTLVAKVRHLVLVAYNKALIKFEEHMREQRESRNDPEWDFCKYFILQEQLAFVLEMLGLYEEALVQYDELDALFSQFVLNSNVTESPKWLETFKQPITSWQAVRLTALVPQNLRELIIKNKASLLDFRSYLFQRQSAMLLPTFKPWEIASRCLTTVHNTLVEVSLLGAHAVDGAAACWAHLACVETLRACERLSSTNSALEACTAMHAPLLHNAKDKLHELGKLCGLLPGCPDPTSEQLHLVVMLSAGMGDSEPNQQTPTDRLKEALCSKICFQNYYLELAELAMGTYKHIGRLRFARQIGRDLASFYSELGESSKAVVFLTEALRSYEEQGWRDLAAQTRLELVAAACKMKDRDRYTKLSARIASTAELEILVRNFYFEEMMKSIKETDKQESVLTELNDCFKIVSVNILPSERGVYITDNKVQCRLVIESLMPKDVLCNKAAICVDSVKQDKTPVKTYKTDLTVGKQSSSPRKSNIDNTDSDSNNLVTSIRLEDLKAKNSFLNKMNITSKLHYKEDRTLQKATVECSHPKVTLRRSDSSKYRKPSATIRNNYETCLATDHIILKPGLNEILLEYVPKMCGLFKLGQVSLLIEGRLEFLSNALIQCKLGYDVETRGVSVYLNKVEPKKDLVAGLEEDVELVVTSGSSRIEENSIIQLKTSTGLQIRFTDSNLSRELSMPIESIEPFQTTKVGLKLFANLQPRREKSIEHTVWLHCPWWETVTEVPLHFTPPMIASWRLLTSNTRKFIHITLKSTIVHLAQFVLSDPVLECDNDNTVADLNPKNAGDMIVASDGTTSSFMWELLKDPLVKAGPMKAVFKVNYRLLEEDISRQFTCPFDIQDYTTLFVVRTKLEPSKGSDFCRASQVCCLQLTVQRVNETEHTSLMYEVLADQTMWAVLGRTAGVITMESNSEGQCVNLDVMPLVAGYLPLPAVRLSKYIAANTRDPSSHPRLEPFSPGQVYHAGKARQLHVLPPLTKEHDNI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: