MonarchBase - Protein-coding gene

DPOGS205028
Transcript	DPOGS205028-TA	3633 bp
Protein	DPOGS205028-PA	1210 aa
Genomic position	DPSCF300288 + 155003-166319
RNAseq coverage	12x (Rank: top 83%)

Annotation
*Heliconius*	HMEL007149	0.0	82.70%
*Bombyx*	BGIBMGA010362-TA	0.0	64.13%
*Drosophila*	Dscam-PBX	5e-65	72.30%
EBI UniRef50	UniRef50_G6CLL7	0.0	88.95%	Dscam n=5 Tax=Pancrustacea RepID=G6CLL7_DANPL
NCBI RefSeq	XP_002080407.1	0.0	48.94%	GD10266 [Drosophila simulans]
NCBI nr blastp	gi\|195581170	0.0	48.94%	GD10266 [Drosophila simulans]
NCBI nr blastx	gi\|195581170	0.0	48.38%	GD10266 [Drosophila simulans]

Group
KEGG pathway
InterPro domain	[2-94] IPR013783	3.8e-10	Immunoglobulin-like fold
Orthology group	MCL25730		Insect specific

Nucleotide sequence:

>DPOGS205028-TA
ATGAAGGAACCCCCAAATCGAGTTGACTTCAGCAACACGACCGGAGCCGTTGTCGAATGTGCCGCACGAGGATCCCCCGCCCCTGACGTCATCTGGGTACGAGCTGATGGAACCGCTGTTGGTGATGTCCCCGGATTGAGACAGGTTCTGCCGAACGGTAACCTGGTATTCCCTCCATTCAGAGCTGAAGATTATCGTCAGGAAGTACACGCTCAGGTATACGCTTGCTTGGCAAGAAACCAGGTTGGAACCATTCACTCCAGAGACGTCAACGTGCGAGCTGTGGTCGCGCAACACTATGATACCGACGTTAACAAGGAGTACGTGATAATGGGAAACAGCATTATACTTAAATGTCAGGTCCCCTCCTTCGTGGCTGATTTCATTGAAGTTCTATCGTGGCATACCGATGAGAAAGAAGATTTTTACCCTGGCGAAAATTATGTTGTTCAGCAACAGTATGAGTCTGAAGTAAACAACGAATATGTGATTAGAGGAAATTCCGCTATTCTCAAATGTTCCATACCATCATTCGTGGCTGATTTTGTCAATGTCATATCGTGGCATGATGAAGCCGAGAACTCGTATACTATAAATGGAACAAAAGAGGGAGAGGTTGTCACCCAATATTATGAAGCTGAAGTAGTCTCAGAATATGTAATTCGTGGAAATACTGCGGTATTGAAATGCAACATCCCTTCTTTTGTTGCTGATTTTGTTAAAGTAGAAGCTTGGGTTGACTCTGATGGTGGCGAATATTTGCTAACCGATGATATCGTTGTTAATCAATTTTATGAAGCCGAAATCCTTACTGAGTACGTTATAAGAGGCAACAGTGCTGTTTTGAAATGTTCAATCCCATCGTTTGTGGCGGATTTTGTCAAAGTTGAGGCATGGATTGACGAAGAAGGAACTGAAATAACGCTCATTGATAATCTTGTTGTGTCACAGTATTACGTGACTGAAGCCGAAAACGAGTACGTGATTAGAGGGAACGCTGCTATTGTTCACTGCAAGATTCCTTCATTTGTTAGTGACTTTGTTTACGTCGAATCTTGGATTATGGATGATGGCGAAATACTTATGATTAGTAATACAAATATGACCGTGGTATCACAACCGTATGAGGCTGAAGCTGACAACGAATATGTCATAAGAGGAAATGCTGCTATAATGAAATGTGAAGTGCCAAGCTTTGTATCTGACTTTGTCTATGTCGAAATGTGGACAGACAGCGACGGTGGTACTTACTTTCCAGGAAATGCAGAGGCGGTGCTCCAAGTGTACGAAGCTAGAGTCAACGATGAGTTTGTGTTACGAGGAAACACTGCCATTTTAAAATGCATCGTGCCTTCTTTCGTAGCAGACTTTGTCTATGTTGTAGCGTGGTTGATGGATAATGAGACGGTCACTGCCAATGAAAACACTAATATCGACTCCGTCGTTCATCAAAATTACGAACCACGCGTTATCGATGAAGATGTACTACGTGGCAATTCAGCAATTGTTAAGTGTCTAATCCCGTCATTTGTAGCTGATTATGTACAAGTTGTTGAATGGTTAACCGACGAAGAATCGCTATCGGTATTTTCGCCGAATGACCCCGAAGGCAATTATGCTGTAAATCAATTCTACGAGTCGCAGGTTTATGATATATATGTTATACGTGGCAATGCCGCAGTTTTCAAGTGCCATATTCCATCTTTCGTATCTGATCACGTGCAAGTACTTTCTTGGCACGATAGTGAAGGGGGAGAATACTCATTAACCGAAAATTATGTTGTGTCACAGGCGTATACTGTAAACTTAGTCGAAGAAAATGTTTTACGTGGTAATGCCGCCATTTTCAAATGCCTTATTCCAAGTTTTGTAACGGAATATGTCGCCGTTTCCTCTTGGATAATATCTGAGGGAGATGATGAAACAGAAATTCAATCAAACGATTTAAACAAAGAGGTCGTTACGCAAGCCTACACGGTTAATCTAATGGAAGAAAGTGTATTACGTGGCAATGCCGCTATATTAAAATGCCACATCTCAACTTTCGTCACTGAATATGTCAGTGTATCGTCTTGGATTATTTCTGAAGCTGATGTAGACGAGCTAGAAATTAAAGCCGAGTCGAATGATTTGGTTGTATCTCAAAGCTATACTGTTAACCTTTGGGAGGAAAACGTTTTACGAGGCAATTCGGCTATACTGAAATGCCACATTCCAAGCTTTGTTACTGAGTACGTCACTATTACGTCTTGGATAATTTCTGAAGGAGATACCGAGGAGTTGGAAATTAATTTAGATTCAGACATTTTATTAGTCGTTTCCCAAGCATATGATGTAAAATTTTGGGAAGAATATGTTTTACGCGGAAATGCTGCTATCCTTAAATGTCAAATTCCCAGTTTTGTTTCTGAATACGTGTCTGTTTCTTCTTGGATAATATCAGAAGATGAAATAGAAAAAGAAATTAAGTTAGACGAATCCACTGATTTAGTGGTTTCTCAAGCGTATGCTGTTAATCTAATGGAAGAATATGTCCTTAGAGGAAATGCAGCTATTGTGAAATGTCACATTCCAAGTTTTGTCTCGGAATACGTCACTGTTGTATCATGGATTGTGAGTGAGGGTGAAGAAGAGGTTGAAATAAAGCCTGATTCTAATGATAAGTTAGATGATGGAAAATATTTGGTACTGCCATCTGGCGAATTACATATCCGTGATGTTGGACCTGAGGATGGCTACAAATCATACCAATGTAGAACTAAACACAGACTTACTGGAGAAACTCGATTGTCAGCAACTAAAGGACGTTTAGTTATCACTGAACCAATGGGCAGCGCTGCTCCAAAAGTAGCGTCGAAAATGATCGATATAACTGAAACGACAATCAATAGTGCTAGTACATTGCTTTGTATGGCTCAAGCCTTCCCCGTCCCAGTGTTCAGTTTCCAACAATGGATAATTCTAGAGGCTTCAGTGCGAGTGTTAATGAAAGCGTTACTTTGTTGTGTCCTGCGCAAGCGTTTCCAGTTCCCCTATCCAGTAATGAAAGCGTTACGTTGTTGTGTCCTGCACAAGCTTTTCCAGTTCCTGTGTCCAGAGCCTATTAACAGTGCCCCACCGAAAGTACCAACTAAAACAATAGAATTCTTGGAGTTTGCGATGCGATCCAGTATTACCTTACTTTGTTTGGCTCAAGCGTATCCTGTGCCTGTTTTTAGAGTCCCTCATTTTCGAGCGGTTCAAAACTGGCATGGTTTGAATTATCCGCTATGGAAGATTTTGCCCTTTTATGTCCAGCGCAAGGGTTTCCTGTCCCAGTTTTTAGAACCGATTGGATCCAAATCGCCTACATTTTCAACAGACAATAAGCTCTCTTGGTATGTAAGAATAGTGGGTCAAAGCTTAGATCTAGCATGTCCCGCTCAAGCATTCCCAGTTCCAGTTTTCAGGTACTTAACTACACATTTCAAGGTTAGGCTCCAGGATATCCCTTGCCATTATACAGAACCAATCGGATCTAAATCTCCTACTTTTTCGACGGATGATAAACTTTCTTGGTATGTACGGACGCTCAATCAAAGCATAGATTTGGTGTGTCCAGCGCAAGCCTACCCTGTACCAGTGTTCAGGTGA

Protein sequence:

>DPOGS205028-PA
MKEPPNRVDFSNTTGAVVECAARGSPAPDVIWVRADGTAVGDVPGLRQVLPNGNLVFPPFRAEDYRQEVHAQVYACLARNQVGTIHSRDVNVRAVVAQHYDTDVNKEYVIMGNSIILKCQVPSFVADFIEVLSWHTDEKEDFYPGENYVVQQQYESEVNNEYVIRGNSAILKCSIPSFVADFVNVISWHDEAENSYTINGTKEGEVVTQYYEAEVVSEYVIRGNTAVLKCNIPSFVADFVKVEAWVDSDGGEYLLTDDIVVNQFYEAEILTEYVIRGNSAVLKCSIPSFVADFVKVEAWIDEEGTEITLIDNLVVSQYYVTEAENEYVIRGNAAIVHCKIPSFVSDFVYVESWIMDDGEILMISNTNMTVVSQPYEAEADNEYVIRGNAAIMKCEVPSFVSDFVYVEMWTDSDGGTYFPGNAEAVLQVYEARVNDEFVLRGNTAILKCIVPSFVADFVYVVAWLMDNETVTANENTNIDSVVHQNYEPRVIDEDVLRGNSAIVKCLIPSFVADYVQVVEWLTDEESLSVFSPNDPEGNYAVNQFYESQVYDIYVIRGNAAVFKCHIPSFVSDHVQVLSWHDSEGGEYSLTENYVVSQAYTVNLVEENVLRGNAAIFKCLIPSFVTEYVAVSSWIISEGDDETEIQSNDLNKEVVTQAYTVNLMEESVLRGNAAILKCHISTFVTEYVSVSSWIISEADVDELEIKAESNDLVVSQSYTVNLWEENVLRGNSAILKCHIPSFVTEYVTITSWIISEGDTEELEINLDSDILLVVSQAYDVKFWEEYVLRGNAAILKCQIPSFVSEYVSVSSWIISEDEIEKEIKLDESTDLVVSQAYAVNLMEEYVLRGNAAIVKCHIPSFVSEYVTVVSWIVSEGEEEVEIKPDSNDKLDDGKYLVLPSGELHIRDVGPEDGYKSYQCRTKHRLTGETRLSATKGRLVITEPMGSAAPKVASKMIDITETTINSASTLLCMAQAFPVPVFSFQQWIILEASVRVLMKALLCCVLRKRFQFPYPVMKALRCCVLHKLFQFLCPEPINSAPPKVPTKTIEFLEFAMRSSITLLCLAQAYPVPVFRVPHFRAVQNWHGLNYPLWKILPFYVQRKGFLSQFLEPIGSKSPTFSTDNKLSWYVRIVGQSLDLACPAQAFPVPVFRYLTTHFKVRLQDIPCHYTEPIGSKSPTFSTDDKLSWYVRTLNQSIDLVCPAQAYPVPVFR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: