MonarchBase - Protein-coding gene

DPOGS210822
Transcript	DPOGS210822-TA	2736 bp
Protein	DPOGS210822-PA	911 aa
Genomic position	DPSCF300027 - 487264-492220
RNAseq coverage	306x (Rank: top 37%)

Annotation
*Heliconius*	HMEL012761	5e-160	85.30%
*Bombyx*	BGIBMGA007137-TA	0.0	62.95%
*Drosophila*	dor-PA	1e-154	37.13%
EBI UniRef50	UniRef50_E2BRY6	0.0	51.78%	Vacuolar protein sorting-associated protein 18-like protein n=13 Tax=Endopterygota RepID=E2BRY6_HARSA
NCBI RefSeq	XP_974055.1	0.0	51.91%	PREDICTED: similar to Vacuolar protein sorting-associated protein 18 homolog [Tribolium castaneum]
NCBI nr blastp	gi\|270012453	0.0	46.61%	hypothetical protein TcasGA2_TC006604 [Tribolium castaneum]
NCBI nr blastx	gi\|380027571	0.0	52.17%	PREDICTED: vacuolar protein sorting-associated protein 18 homolog [Apis florea]

Group
KEGG pathway
InterPro domain	[234-385] IPR007810	1e-41	Pep3/Vps18/deep orange
Orthology group	MCL13704		Single-copy universal gene

Nucleotide sequence:

>DPOGS210822-TA
ATGACTTCAATTTTTGATCAATACGAACAAGCGTCTCAGGTGTCGCAACGCCTAGTTCCTCCTTCAGAACAGATGACGTCTTCAGGTTACATCAACATCCAACTGGATGATAACAAGCCCATGTTTTCTAAGAGACAAATGAATTTCACGCCATCAGATTTAATCACTCACGTTGCTGTTTCTAGTGATTATCTAGTTCTAGCCATGGCAAATGGAATGATATTTAGACTAGATAGTGCAGAGGCAGCATTGGCTGGTCTTGGTGGTGTATGTGAGTTGTTGTACCGCCGATACGCACCACCTTCCTCCGCTGCCACCGCCCTGAGACTGCATCACTGCTCTTTAAGACTATTGAGACATCTGGCTCACCATAACGCACACATGCACCGAGCACCTATAGAGTATATTTTTGATATAGGTAAGGGAACTGACACACCCATTACTGGTATCCAGTTCCATAGAGTGAACAACACAACCAAATTCTTCATATTTGTCACAACCCCCAAAAGGCTGTATCAATTCATCGGCCATGCTATGGCTTCCGATGAGAAACCATTCCTGCAATCAATATTTCACTCTTATCTAACAACCGTAGAGACAGGCTTCCATGAAATACCTTCAACTCTGAAATACTCCAAATTGCAGTTCTTTTTTGATAAAACAAATAGTCCAAAAACATTTGCCTGGTTGACGGAGCCAGGTATATTTTATGGGCAGCTAGATCCTACTTCTCAACAGAATTCCAACTCACTGTTCACTCAAGGCGAGCTCATAACTTACTCTGATAAAAGTGAAAAAAATGACACCAAAGAAGCAACGCCACTCTCATTCGTACTTACAGAGTTCCATGTCCTCCTCATGTATTCTGACAGGGTCAAAGCGGTGTCGCTGCTGAACCAAAAACTGGTATACGAAGACAGATACTCAGAAGTACATGGAAAGTTGAAGAATATAGTGAAAGATCCTATCGGAAAAACGATTTGGACCGTGACCGATAAAGCCGTTTTTAGATATAAGGTCGAGAGGGAAGAAAGAAATGTTTGGAGGATATACTCTGATAAGGAACAATTCGACCTGGCCAAGCAATACTGTCAAAATAATCCAGCCTATATAGATATAATAAACGTGAAACAGGCAGAACTATTGTTCAAGAAAGGCGATTACGATAAAAGTGCTGAAATATACGCGGAAACACAGAGCAGCTTCGAGACTGTTTGCCTCAAGTTTTTGGAATGCGATCAGGTTAACTCGCTGAAGGTGTACCTCAGTAAGAGATTGGACACTTTGGACGACGACAAGACCCTGATATCGATGATAGTTATTTGGATGACGGAGTTGTTCCTGTCGCAACTCGGGTCGCTCCGTCGCACCGGGAAAGCTGACTCAAACGAGTACCATCAGATCCAGAGCAATTTCGAGATCTTCCTTCTCCAACCCAAGGTCACGAAATGTATGCAACACATTAAAACTGTCATTTACGATCTGATGTCTTCACACGGAGATAAGCAGAACCTCATCAAGTTGACTATCATCAACGAGGACCACGAGAACGTAGTGGCGCAAAATATTTACGAGAAGTCGTACGTACAGGCTCTGAACATGCTGCAGCATTTGAAAAAACCCGATCTATTCTATCAGTTCGCTCCGGCCCTGATGGAAGAAATACCGAGAGAAACCGTCAACGCCTTGATTTCTCTTGGACCGATTCTAAGTTCCTCAAGATTGTTGCCGGCGTTCCTCTCCTGCGAAAACGACGAGGCTCATGTATCTGAAATCATTCGATACTTGACATTCATGCTACAGAATTACAATGTCAAGGATCGTGCGATTCATAACTATCTGTTGACGCTGTACGCGGAACACGACGTGCCGGCTCTCATGAGATATCTGTCACGGCAAGGGCAGGAGCTGTCGATGGTGAACTATGACGTACATTATGCCTTACGACTCTGTAGAGAGAAGAACTTAACGGAAGCGTGCGTGAAGCTGTCGGCGCTGCTCGGCCTTTGGGAGTCGGCGGCTGAATTAGCGCTGCAAGTTGATACGGGCCTGGCCAAGACTGTGGCCGACATGCCTGATGATGTGACGCTGCAGAGGAGATTGTGGCTTGGAGTCGCGGAACACGTTATCACCAAGAACCAGGACATCAAGGTCGCCATGAGTCTTCTCGAAGAATGTCCTCTGATCAAAATCGAAGATATCTTACCATTCTTCAGTGACGTCATTACTATTGACCATTTTAGGGAACCCATCTGTCAGTCCTTACAGGAATATAACAATCAAATAGAAGAACTCAAAGCGGAAATGGAGGACGCCACGAAGTCAGCCGAGTATGTCCGCAGCGAGATCCAGTCGTTCCGTGGTCGGAGCGCGTTGGTGTGTTCGTCAGACACGTGCTGCGTGTGTTCGCTGGCGCTTCTCCTGCGACCCTTCTACCTGTTCCCTTGCAGCCATCGCTTCCACAGCGACTGTCTCCGGACCGAGATACTGCCGGTGCTGGCGCCCGCACGTCGCAATAAGCTAACGGATCTTCAGAAACAGCTGACGCTGCTGTCTAACATAGAACTGTCGACGGTGACGTCTAGTGGCCTTCCGCTCAGAGAAGTGTTGAAGAACGAGATCGATGACATAGTGGCCAGCGAGTGCCTCTACTGCGGGGAGTACATGATCACTTGTATCGATAGACCATTCATCGCCGACGAGGACTGGGACCGGGTTATGAAGGAGTGGGAATGA

Protein sequence:

>DPOGS210822-PA
MTSIFDQYEQASQVSQRLVPPSEQMTSSGYINIQLDDNKPMFSKRQMNFTPSDLITHVAVSSDYLVLAMANGMIFRLDSAEAALAGLGGVCELLYRRYAPPSSAATALRLHHCSLRLLRHLAHHNAHMHRAPIEYIFDIGKGTDTPITGIQFHRVNNTTKFFIFVTTPKRLYQFIGHAMASDEKPFLQSIFHSYLTTVETGFHEIPSTLKYSKLQFFFDKTNSPKTFAWLTEPGIFYGQLDPTSQQNSNSLFTQGELITYSDKSEKNDTKEATPLSFVLTEFHVLLMYSDRVKAVSLLNQKLVYEDRYSEVHGKLKNIVKDPIGKTIWTVTDKAVFRYKVEREERNVWRIYSDKEQFDLAKQYCQNNPAYIDIINVKQAELLFKKGDYDKSAEIYAETQSSFETVCLKFLECDQVNSLKVYLSKRLDTLDDDKTLISMIVIWMTELFLSQLGSLRRTGKADSNEYHQIQSNFEIFLLQPKVTKCMQHIKTVIYDLMSSHGDKQNLIKLTIINEDHENVVAQNIYEKSYVQALNMLQHLKKPDLFYQFAPALMEEIPRETVNALISLGPILSSSRLLPAFLSCENDEAHVSEIIRYLTFMLQNYNVKDRAIHNYLLTLYAEHDVPALMRYLSRQGQELSMVNYDVHYALRLCREKNLTEACVKLSALLGLWESAAELALQVDTGLAKTVADMPDDVTLQRRLWLGVAEHVITKNQDIKVAMSLLEECPLIKIEDILPFFSDVITIDHFREPICQSLQEYNNQIEELKAEMEDATKSAEYVRSEIQSFRGRSALVCSSDTCCVCSLALLLRPFYLFPCSHRFHSDCLRTEILPVLAPARRNKLTDLQKQLTLLSNIELSTVTSSGLPLREVLKNEIDDIVASECLYCGEYMITCIDRPFIADEDWDRVMKEWE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: