MonarchBase - Protein-coding gene

DPOGS206558
Transcript	DPOGS206558-TA	4377 bp
Protein	DPOGS206558-PA	1458 aa
Genomic position	DPSCF300108 - 708244-724159
RNAseq coverage	9x (Rank: top 85%)

Annotation
*Heliconius*	HMEL004375	78.61%
*Bombyx*	BGIBMGA013795-TA	75.22%
*Drosophila*	Dscam3-PB	32.64%
EBI UniRef50	UniRef50_A8JR35	33.36%	Dscam3, isoform C n=9 Tax=Drosophila RepID=A8JR35_DROME
NCBI RefSeq	XP_968319.2	33.54%	PREDICTED: similar to CG31190 CG31190-PC [Tribolium castaneum]
NCBI nr blastp	gi\|189242122	33.54%	PREDICTED: similar to CG31190 CG31190-PC [Tribolium castaneum]
NCBI nr blastx	gi\|340712210	33.03%	PREDICTED: Down syndrome cell adhesion molecule-like protein CG42256-like [Bombus terrestris]

Group
Gene Ontology	GO:0005515	8.4e-15	protein binding
KEGG pathway
InterPro domain	[890-995] IPR008957	2.5e-25	Fibronectin type III domain
	[898-993] IPR013783	7e-22	Immunoglobulin-like fold
	[901-985] IPR003961	8.4e-15	Fibronectin, type III
	[499-592] IPR013098	1.5e-12	Immunoglobulin I-set
	[411-483] IPR003598	5.5e-11	Immunoglobulin subtype 2
	[201-302] IPR003599	5.1e-09	Immunoglobulin subtype
Orthology group	MCL10022		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206558-TA
ATGCAATGTGCTGCCACTGGAGATAGACCTCCACAGTTTGTTTGGGAGCGAGATGGAGTTGCTGTATCAAGCAACACAGATCCTAGGTATGCGTTGGGACAAATTATGACGGCAGATAACTCTGTAATAGCCCAACTCAATATAACCAGAGTCCGAGTGGAAGATGGCGGATTGTACGCTTGTATAGCGAAGGAAGGTGAACATTCAGCCAGCAGTGAAAACAGACTGGACGTTTATGATTTAGATAAAAGAAGACGATTACGTCGAGCTCTCACAGATAATAGGCTGGTTATAACCCAACATTTTACTGAGCGAACCGTAACTCCAGGTGGTGATATAAGTATGCAATGTGCCGCCACCGGAGATAGACCTCCACAGTTTGTTTGGGAGCGAGATGGAGTTGCTGTATCAAGCAACACAGATCCTAGGTATGCGTTGGGACAAATTATGACGGCAGATAACTCTGTAATAGCCCAACTCAATATAACCAGAGTCCGAGTGGAAGATGGCGGATTGTACGCTTGTATAGCGAAGGAAGGTGAACATTCAGCCAGCAGTGAAAACAGACTGGACGTTTATGGTCCACCTTACATTCGGTCACTACCACCAATTAAGGCCCAAAGCGGTGAATCAATAAATCTTAGATGTCCATTCTATGGATATCCAATAAGCAAAATCGATTGGGAACACAAAGGCAAAACGGTTAACCTAAACAGTCTTTTTCAATCACGTTATAAAAGAACACAAAATCACCAAAAAAGAAAATCAAGAAGAAGCATTGTCAATATACACGGAGTATTGACAATTCCTGAAGTAAATAAAGAAGATAATGGAGCTGTTTATACTTGTATAGTGACATCGCCGTCTGGTGAAATGGCTAGACGATCGTTTGAAATACAAGTTATAGAGGCACCCATTTTGGAGGATTTACTTCTTGGTAATAACCTACAGGAAGGACAAATAGTAAATATTTATTGCAACGTACGAAGCGGTGATTTACCAATACATTTCGAATGGTTAAAAGACGGAAAAAGAATTTCAAGCAATTTGAAGGTAATCGAAAGAAGTTCGGAATTATTCAGTGCTCTGGTTATCAAGAAAGTTGCGTTGGAACATTGTGGTACATACACTTGCGTAGCGTCGAACCACGTAGCCAAGGTCAATAAGTCCACGGAATTATATATCAAAGTTGCACCGAAATGGCTAGAAGAACCTTCAAATTCGTCTCTTTTGCTCGGAAGAAAAGGCATTGTATCTTGCAGCGCGAGCGGCTATCCACAGCCACAAGTACATTGGATGAAAAAAGATGCTCTTCTTGGTACTTGGCAACCTGTCCTTGAACTAGCTGGAGGAGGGATCCTAAGTCTTCCCAACGGAAGTCTTGTCATTGAAGAAGTTTCCTTGACAGACGAGGGCTTGTATTCATGTAATGTGGAAAATGGTGTTGGAACACCACTGAGCAAAACTGTCTGGATGACAGTGAATAAACCAGTGCACTTTGACACGTCATCAGCTAATGTAACATCACGACTGGGCCACGCCGTCTCTTTGGAATGTCGCGCGCTTGGTGATGACCCTATCAGAATCACATGGAACCATAATGGAAACAATATAGACTTTCAGAGTCACAGAGCAAAGCACTCAGAGACAAAAACCTCGCTTGGTGTTACCAGCACCATAAACATACAGTATTCAGAAACAGCTGACGCTGGCTTCTATCAATGTCGAGCGAGCAATCCGTATGGATCGGCTAGCTTCAACACATTCCTTACCATATTAGAACCCCCCACCTCTCCCTCCGAACTCAGGGTAGAAACAGTTCGATCTCGTACAGCATCAGTGTCATGGCGGGACGGGGCGCACGCTGAGTATTACACATTACAACACACGCCTGCTCATTACGCTGATGACTGGGAATACGCCGTTAGTCTCAATATTACAAGGAAAGGCAACGACATTCGACAAACGATAGAGCTACAAAACATCAGACCAGCGACGGCTTACGCGGTGCGAGTAGCGACTGGTAATGAAGTGGGTGTCAGTCGTTTCACAACGCCTGTACATTTTACAACACACGAGGAAGCTCCATCTTCAACACCAATTAATATACAAATTGAACAAACTGAAAATCCTGGCGAACTGTTTGTCTCCTGGCTGCCTCCACCCAAAGACACTCACAACGGCATCATAACAGGATACCACGTGAAGGCTGTTCCACAACAAGGTTCCCCTATTTTAGCAGATACTGATACAAGGACTTTGAAAGTTTCAAAGTTATCCGGAAAACAAGAGACTGTCATCAGTGGTCTACTCAAAAATACCAGATATGCTGTCTCCATATCAGCTTTCAACAGTGCCGGATCAGGTCCATTTTCGATTCCAGTATTTCAAGATACTATGGAAGGAGCTCCCGAAATCGCTCCATCATCAGTTGAGTGTACGGCCGTATCATCATCGTCACTGCGCGTCGGCTGGCAGCCCATAGCAATACACGAACAGGGAAGTTCTTTGATCGGTTACTCCATTCTGTATGGAACTGAAGAAAGCTCTTGGCAGAACCAAACTTCTCTCCACACTGAAATTTATCTTCAAGGTCTTTCTAAATACAGCAACTACACGATAAAAGTTGCAGGTTTTTCCAACTACGGTGCCGGGCCGTTCTCGTTCCCAATAGTTTGCACTACGTTACAGGATGTTCCTGATCCACCTTCAGATATCAAAGTACTTATCCTATCATCCACGTCACTGTTGGTCAGTTGGAAGAAGCCGGAACATGCTAACGGGGAACTTTTATATTATACGGTTTATGTGAAACCAACTTCAGGCACTGGTCCACCTCTAACGAGTCGTGTGGATCCTTCTCGGACGACAGCTGATATCAAGGAGTTGACGAGCGGAAGGTCGTATGAAGTGTGGGTGACTGGAAGTACCGCGGCTGGTGAGGGCGCACCTAGTAGGAGAGCCTCACATACACCCGCTAATAGAGTTGTGGCAGGTGTCGCATCATTAGGTGGCACCATATCAGTGGGAGTGGGTTCATCCTTACTACTCGTGTGTCAGTGTATCGGAGTACCACCACCTCGCACTGTGTGGTACCACAAACATAATATAATAACTCACCATCCAAGATTCACGAGAAATCATGACGACAGCTTGCTGATTAACAATATAGACCAATCCCTGAGTGGGAACTACACGTGTCTTGCAAAGAATCTTTATGGTTCTGATTCAGTGGAGTACACCGTTGTAGTTCTTCCGCTGCCCGAAGCACCAACACTACGAGCCACGCCATATAAAGACTCCATATTAGTTGAATGGGAACAACCTTATTATAGCATCAGTAACCGTAGCTCGAACCAGAAGATTACTTATAGCCTAACATGGAAAGAAGCAAGCGGTCCGTGGCAAGAAGTATGGTCACCAAATAAAGTACCTAATAAATTATCCAACCTCTCTGGGGTTCAAAAGCATGCGCTAACTGGCCTTAAATGTGGTACAAAATATTCATTGAGGATCACAGCTACTAACAAAGTTGGGACGTCACAACCAGCTTATTTGGATGTTAGCACGCTGGGCGGACCTCCCATTGCGCCGACCTCAACGGAGTGGTTCTGGAGCAATTGTTCCCACGTGTTTATCCAGGCTGCTGGTTGGGATGACGCGGGATGTGAGCTCAGAACCTTGGAGTTGGAACATCGAGCTCTTGGAGCCAGGAGTTGGATGAGACCTATCAATATATTGTCGTACACGGGCTATCCCTACCAGTATCGAGGATCCTTCGCTCTGTCAGGATTGTCCCCCGGGACATGGTACGTCCTCCGAATCACCGCCACCAACGAGGCTGGTAGCGTTACCACCGTTTACAACTACGCCACTAAAAACGAGGATGGCAGTGAAGTTGGTCCACCGTCGGAAATCTTTGACATCAACATGCTCGTGATAGTCCTAAGCTCAATTCTCCTAGCCGTCTGTCTCATCTGCTGCGTTTATATTCTGGTTAAGAGACAACGCAATGGCAACTTAACGGAATACCGTGACTCAATAACAGTCGACAAATCTGAGAGTGGCAACATAACAGCAAACACGTCACACAGTAATCTAGCGAATGTCAAAGAGAATGCTATGAACGCTCAGAACAGAATATACAGCGCTCCAATACATGTTAGGAATAATAGCAAACATGAATTATATGAGATAAGTCCTTACGCCCAATTCGCTGTCGGCTTTCGAACGTTCGGTCACGCTGAAAACAATGATGTTCCAAGACATATCAAACACAGATACGATACAGAAACGAGCTTTCAAGTTTGCTCTGAGTCAGAGGACAGTGACAGCATATCAAAATCAACCCTGAAGAGCGTACCGAGAAGTAAGTAG

Protein sequence:

>DPOGS206558-PA
MQCAATGDRPPQFVWERDGVAVSSNTDPRYALGQIMTADNSVIAQLNITRVRVEDGGLYACIAKEGEHSASSENRLDVYDLDKRRRLRRALTDNRLVITQHFTERTVTPGGDISMQCAATGDRPPQFVWERDGVAVSSNTDPRYALGQIMTADNSVIAQLNITRVRVEDGGLYACIAKEGEHSASSENRLDVYGPPYIRSLPPIKAQSGESINLRCPFYGYPISKIDWEHKGKTVNLNSLFQSRYKRTQNHQKRKSRRSIVNIHGVLTIPEVNKEDNGAVYTCIVTSPSGEMARRSFEIQVIEAPILEDLLLGNNLQEGQIVNIYCNVRSGDLPIHFEWLKDGKRISSNLKVIERSSELFSALVIKKVALEHCGTYTCVASNHVAKVNKSTELYIKVAPKWLEEPSNSSLLLGRKGIVSCSASGYPQPQVHWMKKDALLGTWQPVLELAGGGILSLPNGSLVIEEVSLTDEGLYSCNVENGVGTPLSKTVWMTVNKPVHFDTSSANVTSRLGHAVSLECRALGDDPIRITWNHNGNNIDFQSHRAKHSETKTSLGVTSTINIQYSETADAGFYQCRASNPYGSASFNTFLTILEPPTSPSELRVETVRSRTASVSWRDGAHAEYYTLQHTPAHYADDWEYAVSLNITRKGNDIRQTIELQNIRPATAYAVRVATGNEVGVSRFTTPVHFTTHEEAPSSTPINIQIEQTENPGELFVSWLPPPKDTHNGIITGYHVKAVPQQGSPILADTDTRTLKVSKLSGKQETVISGLLKNTRYAVSISAFNSAGSGPFSIPVFQDTMEGAPEIAPSSVECTAVSSSSLRVGWQPIAIHEQGSSLIGYSILYGTEESSWQNQTSLHTEIYLQGLSKYSNYTIKVAGFSNYGAGPFSFPIVCTTLQDVPDPPSDIKVLILSSTSLLVSWKKPEHANGELLYYTVYVKPTSGTGPPLTSRVDPSRTTADIKELTSGRSYEVWVTGSTAAGEGAPSRRASHTPANRVVAGVASLGGTISVGVGSSLLLVCQCIGVPPPRTVWYHKHNIITHHPRFTRNHDDSLLINNIDQSLSGNYTCLAKNLYGSDSVEYTVVVLPLPEAPTLRATPYKDSILVEWEQPYYSISNRSSNQKITYSLTWKEASGPWQEVWSPNKVPNKLSNLSGVQKHALTGLKCGTKYSLRITATNKVGTSQPAYLDVSTLGGPPIAPTSTEWFWSNCSHVFIQAAGWDDAGCELRTLELEHRALGARSWMRPINILSYTGYPYQYRGSFALSGLSPGTWYVLRITATNEAGSVTTVYNYATKNEDGSEVGPPSEIFDINMLVIVLSSILLAVCLICCVYILVKRQRNGNLTEYRDSITVDKSESGNITANTSHSNLANVKENAMNAQNRIYSAPIHVRNNSKHELYEISPYAQFAVGFRTFGHAENNDVPRHIKHRYDTETSFQVCSESEDSDSISKSTLKSVPRSK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: