MonarchBase - Protein-coding gene

DPOGS211056
Transcript	DPOGS211056-TA	6354 bp
Protein	DPOGS211056-PA	2117 aa
Genomic position	DPSCF300446 + 60609-114670
RNAseq coverage	77x (Rank: top 65%)

Annotation
*Heliconius*	HMEL007794	91.58%
*Bombyx*	BGIBMGA009611-TA	75.21%
*Drosophila*	sli-PC	50.96%
EBI UniRef50	UniRef50_Q7QCT2	54.40%	AGAP002793-PA n=9 Tax=Pancrustacea RepID=Q7QCT2_ANOGA
NCBI RefSeq	XP_972265.1	53.12%	PREDICTED: similar to AGAP002793-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91078086	53.12%	PREDICTED: similar to AGAP002793-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91078086	53.12%	PREDICTED: similar to AGAP002793-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005509	6.8e-10	calcium ion binding
	GO:0005515	7.2e-07	protein binding
KEGG pathway	dme:Dmel_CG8355	0.0
	K06850 (SLIT3)	maps->	Axon guidance
InterPro domain	[1729-1906] IPR008985	1.4e-42	Concanavalin A-like lectin/glucanase
	[1929-1939] IPR013320	1.2e-41	Concanavalin A-like lectin/glucanase, subgroup
	[1753-1889] IPR001791	2.6e-31	Laminin G domain
	[1761-1891] IPR012679	4.7e-28	Laminin G, subdomain 1
	[1419-1470] IPR000483	3.3e-11	Cysteine-rich flanking region, C-terminal domain
	[2029-2109] IPR006207	2.7e-10	Cystine knot, C-terminal
	[1557-1593] IPR001881	6.8e-10	EGF-like calcium-binding
	[1599-1631] IPR006209	7.2e-07	EGF
	[1560-1593] IPR006210	1.2e-06	Epidermal growth factor-like
	[694-726] IPR000372	2.5e-06	Leucine-rich repeat-containing N-terminal
Orthology group	MCL10589		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211056-TA
ATGGCGGCTGTAATTAACCGGCATTGGGGTTATATAATATGCCGTAAGATGTTGTTGATAGTGCTGTCGTGCGTTCTGGCCGTGGGCGCCGCCTGTCCGTGGGCGTGCTCCTGCCGGCCAGGTGCCGCTGACTGCGCCCATCGAGCCCTGCTCCACGCACCTCGAAGACTGCCAGTAGATGCCCATAGGCTAGATCTTCAAGGCAACAATATAAGCATCATCTTCCAGAGCGACTTCCAGAACCTGAAGGAACTTAAGATTTTACAATTATCAGAGAACCAAATTCACACTATAGAGAGAGATGCGTTCTTGGAGCTGAACGTACTGGAGCGACTGAAACTGAGCAATAATCGACTCGGCCACATACCTGATGGTATTTTTCTGAGATTGAGGCATCTACAACGTTTGGACTTAAGTCGCAACGAACTGACCGCTATCAGCAGACGGACCTTCCGAGGTCTGACCGCGCTGAAAAGTCTACACTTGGATGGAAACCAGCTCAAGTGCATTGATGAAAAGGCGCTGGAACATTTGAAAAGCTTGGAAGTCTTAACCCTGAATAATAATAACCTGACGTACCTATCACTGGAGGCGGTGTCTGTCGCTCGTCTCCACACCCTGCGACTGTCGGACAATCCGATCGTGTGCGACTGTCGTGTCGCACGTCTGGCTGCGGCCGTACGCGCCGCTGGAATACTCGGACTGGGAGCGAGATGTCAGGCTCCAGCAACCTTGAGAGGAGCCATGCTGACGGAGTTGGAAGCCCAAGATTTAATATGCAACGGACCTAACTCCATAGCGGAGTGTTCGTCAGAGCCGCGCTGTCCGCCCGCGTGCCGTTGTTCCACCGACGGCACCGTCGACTGCCGAGAGAAACTCCTCACAGAGCTGCCCACCACCATACCGCACAGAGCCACTGAGATCCGTTTAGAACAGAACGAGATAACTGAAGTAGGCGCTGGCGCCTTCTCGGCTGTGAAGAGAGTCGCTCGCATCGACCTGTCCAACAACAAGATCGCCAAGATGGCCGGCGACGCTTTCAACGGCCTAACACACCTGACTTCATTAGTTCTCTATGGGAACAAGATAAAAGACCTGCCATCAGGGATCTTCCACGGGCTGACATCGTTACAACTGCTTTTGCTCAATTCAAACGAGATAAGTTGCGTCCGTAAAGACACGTTCAGGGACCTGCAGAGTCTAAAACTACTATCTCTCTATGACAACAACATCAGGTCGCTTCCGAACGGAACCTTCGATTCACTCACCGGGATACAAACTTTGCACTTGGGTCGTAATCCGTTTTCCTGCGACTGCTCGCTGCGCTGGCTGGGCGCCTACCTCCGCCGGAACCCCATCGAGACCTCGGGCGCCAAATGCGATTCCCCCAAGAGGATGAACAGGAAACGAATCGATGCTCTGAGGGACGAGAACTTCAAATGCAAACCCGGTGAGGAGCCTCCGGACGCGTGCGGCGACGCCCCGCCCTGCCCCGACACGTGCGCCTGCTCGGGCGCCGGCCGCGCGCTGCGGGTGGCGTGCGCCCGCGCAGGACTCGCCGACGTGCCCAGAGACCTGCCGCTCACAACACACGCACTGATCATGCCGGACAACAATCTCGGTCAAATTAAATCTGACGGACTATTCGGGAGACTGCCGGACCTCGCGAAGCTGGACCTGAGGAACAATGGTATAACAGTGATAGAGGACAACGCGTTCGACGGCGCGGTGGCCATGAGGGAGCTCTCGCTGGATGGGAACCTGCTGCAGACTGTGGGCGACAAAATGTTCTTCGGACTGCACAGCCTTACTCTGCTGTCCCTGACTGATAACAAAATAAGGTGCATCACCCCCGGCTCCTTCGACCACCTGACGATGCTGTCGACTCTTTCGTTGGCCAACAACCCTATCGCGTGTAACTGTCACATGTCCTGGTTGCCGGGCTGGTTGCGAGGGCGGCGACTCTCCTCGGGGGTGACGTGCGCCCTGCCCCTCGGCCTGCGCGGCACTGAGCTCCAACAGCTGGAAGTGGTCGACTTCAAATGTGCCCCGGACGAGCAGGGCTGCCTCCCGGCGGACTACTGCCCCGAGCGCTGCGCCTGCGCCGGGACCGTGGTGAGATGTGCTCGAGCCAGGCTGACCTCGCTTCCGCCGAGAATACCGCCCTACACCACGGAACTGGACTTAAGTCGCAACGAACTGACCGCTATCAGCAGACGGACCTTCCGAGGTCTGACCGCGCTGAAAAGTCTACACTTGGATGGAAACCAGCTCAAGTGCATTGATGAAAAGGCGCTGGAACATTTGAAAAGCTTGGAAGTCTTAACCCTGAATAATAATAACCTGACGTACCTATCACTGGAGGCGGTGTCTGTCGCTCGTCTCCACACCCTGCGACTGTCGGACAATCCGATCGTGTGCGACTGTCGTGTCGCACGTCTGGCTGCGGCCGTACGCGCCGCTGGAATACTCGGACTGGGAGCGAGATGTCAGGCTCCAGCAACCTTGAGAGGAGCCATGCTGACGGAGTTGGAAGCCCAAGATTTAATATGCAACGGACCTAACTCCATAGCGGAGTGTTCGTCAGAGCCGCGCTGCCCGCCCGCGTGCCGTTGTTCCACCGACGGCACCGTCGACTGCCGAGAGAAACTCCTCACAGAGCTGCCCACCACCATACCGCACAGAGCCACTGAGATCCGTTTAGAACAGAACGAGATAACTGAAGTAGGCGCTGGCGCCTTCTCGGCTGTGAAGAGAGTCGCTCGCATCGACCTGTCCAACAACAAGATCGCCAAGATGGCCGGCGACGCTTTCAACGGCCTAACACACCTGACTTCATTAGTTCTCTATGGGAACAAGATAAAAGACCTGCCATCAGGGATCTTCCACGGGCTGACATCGTTACAACTGCTTTTGCTCAATTCAAACGAGATAAGTTGCGTCCGTAAAGACACGTTCAGGGACCTGCAGAGTCTAAAACTACTATCTCTCTATGACAACAACATCAGGTCGCTTCCGAACGGAACCTTCGATTCACTCACCGGGATACAAACTTTGCACTTGGGTCGTAATCCGTTTTCCTGCGACTGCTCGCTGCGCTGGCTGGGCGCCTACCTCCGCCGGAACCCCATCGAGACCTCGGGCGCCAAATGCGATTCCCCCAAGAGGATGAACAGGAAACGAATCGACGCTCTGAGGGACGAGAACTTCAAATGTAAACCCGGTGAGGAGCCTCCGGACGCGTGCGGCGACGCCCCGCCCTGCCCCGACACGTGCGCCTGCTCGGGCGCCGGCCGCGCGCTGCGGGTGGCGTGCGCCCGCGCAGGACTCGCCGACGTGCCCAGAGACCTGCCGCTCACAACACACGCACTGATCATGCCGGACAACAATCTCGGTCAAATTAAATCTGACGGACTATTCGGGAGACTGCCGGACCTCGCGAAGCTGGACCTGAGGAACAATGGTATAACAGTGATAGAGGACAACGCGTTCGACGGCGCGGTGGCCATGAGGGAGCTCTCGCTGGATGGGAACCTGCTGCAGACTGTGGGCGACAAAATGTTCTTCGGACTGCACAGCCTTACTCTGCTGTCCCTGACTGATAACAAAATAAGGTGCATCACCCCCGGCTCCTTCGACCACCTGACGATGCTGTCGACTCTTTCGTTGGCCAACAACCCTATCGCGTGTAACTGTCACATGTCCTGGTTGCCGGGCTGGTTGCGAGGGCGGCGACTCTCCTCGGGGGTGACGTGCGCCCTGCCCCTCGGCCTGCGCGGCACTGAGCTCCAACAGCTGGAAGTGGTCGACTTCAAATGTGCCCCGGACGAGCAGGGCTGCCTCCCGGCGGACTACTGTCCCGAGCGCTGCGCTTGCGCCGGGACCGTGGTGAGATGTGCTCGAGCCCGACTGACCTCGCTTCCGCCGAGAATACCGCCCTACACCACGGAACTGTACTTGGAGTCCAACGAGATCACCAGCATCTCCTCGGAGCAGGTCCGTCACTTGACGCAGCTGACGAGGCTGGACCTCTCCAACAACAGGATCGCAGTGCTCTCCAACAACACCTTCGAAGGTCTCAGCAAGCTCTCCACGCTCATCGTCAGTTACAACAGGCTGAGATGCGTTCAGCGGGACGCGCTCAAGGGTCTGACGCAGCTCCGCGTGCTGTCTCTCCACGGCAACAACATCTCCACTCTGGCGGACGGAGTCTTCAGAGACCTGGAATCCATCTCACACGTTGCCCTGGGGTCCAATCCCTTGTACTGCGACTGCAGCGCGCGCTGGCTGTCCGAGTGGGTCAAAGTGTCCGGGGAGTATGTGGAGGCGGGCATCGCTCGCTGTGTGGCCCCACCGCCCATGAGGGACAAACTGTTGCTCAGCACAGCTACGAGCGCTTTCGTTTGTAACGGTAACCCCCCACCGGAAGTCGTGTCCAAATGCGACCGCTGCTACCGGAACCCGTGTCTCAACCAAGGCACGTGTCGCTCCACCACATCCGGAGGCTTCGCCTGTTCCTGTGCCCGAGGCTTCCACGGAGAAACTTGTCAGTATGAGATAGACGCGTGCTACGGCTCTCCCTGCGCCCAGGGAACCTGCCAGCTACTAGAAGAGGGGAGGTTCCATTGTGCGTGTCATGCTGGATACACAGGCGTGAGGTGTGAGGTGGACATTGACGATTGTGTCGGCCACCGCTGCAAGAACAACGCGACCTGTGTGGACCACCTGGAGGGCTACACCTGCAAGTGCGCTCCAGGTTTCATGGGCGAGTTCTGCGAGAAGAAGATACCGTTCTGCACGAGCGGCTTCAACCCTTGCGCCAACGGAGCCTCGTGCGTGGACCTCGGCAGCCACTACACGTGCGCGTGCCCCAAGGGCTACTCGGGACAGAACTGCACTATCAACGCGGACGACTGTATGAACCACATGTGCCAGAACGGCGCTACTTGTATGGACGGGCTGGACGAGTACCGCTGCGCATGCGCCGCGGGGTACGCGGGCCGGTACTGCGAGGCGGCGCCCCACGCGGCTCTGGGGACTTCGCCCTGCGCTCACCACGACTGTGTGCACGGAGTCTGCTATCTGCCGGCCCTGGCGCTACACGATGACATCATGATGGAGAGACCTCTGCTGGCGCCGCCCGACTACCTCTGCAAGTGCGCGCCGGGATACTCGGGTCGGTACTGTGAATACCTGACCTCTCTGACCTTCAACCACAACGACTCTCTCGTCGAACTGGAACCGCTAAGGACCTCGCCGCAAGCTAACGTCACACTCGTTTTTAGCACAAAACAGTTGCACGGAGTCCTCATGTACTTCGGAGACAACGAACACTTGGCCGTGGAACTGTTCAACGGAAGAATTAGAGTTAGCTACGACGTCGGCAACCATCCCACGTCCACCATGTACAGCTTCGAAATGGTGTCCGACGGTAACTACCACAAAGCTGAGCTTTTGGCCATCAAGAAGAATTTCACTCTCCGCGTCGACGACGGGCCCGCCAGGTCCATCATAAACGAAGGCAGCAACGAATTCCTGCGCCTGGAGCGCCCGATGTTCGTGGGAGGGGTGCCGCCGGATGTCGCCAAGGACGCCTTCAGCAAGTGGCACCTCCGAAACATAACTAGCTTCAAAGGGTGTCTCAAAGAGGCGTGGATCAACCACAAACGTGTCGACTTCGTGAACGCAGCTCGAGCGACTCGGACCACCGCGGGTTGCGGGGGCGGAGGCCTAGCCGGGCCCGGGGCCGAGGAGCCCCCGGCGCCCCCGCACGCTCTCCAGGAAGACGGCGCGCACGAACCAGACCCCTGCGTGCCGAATCCTTGCGCTCGCGGCGGGCGCTGCGTCCGCGAGGCGGGCTCCCGGTCCGACTACACGTGTCGCTGCCGCGCCGGCACCGCGGGGGCGCAGTGCGAGCGCCGAGCGTCTGTTGGCGGTACACCAGTCATCACTCAGTCGAAACTACCGCCTCGAAAACAGGTCATCAACAACAACAACGTCCAAGCATCGCCAGCTGCACCTTCGCCGAAGCAGTATCCAGACCAAGCCTCTGCACCACAAATGCCATCAACTGCAGCCTGCAGAAAGGAAGCGACGCGTGAATTTATAACAGAGGGCTCGTGTAGGAGCCGCAGGCCTGTCCGAGGGGCCCGCTGTACCGCCCGGACTGTGGGGCCCGGAGACAGTGGGGGGGCCTGTCCGCGAGCGACGTGCTGCGCTCCAAGGAAGACTAAGAAAAGGAAGATTCGACTCGTCTGCTCGGACGGCACGCGGTACACCAAAGACATAGAGATAGTGCGGAAATGCGCCTGCGGGAAGAAATGTCCAGCGAGAAACACACCATTCCTACACTAG

Protein sequence:

>DPOGS211056-PA
MAAVINRHWGYIICRKMLLIVLSCVLAVGAACPWACSCRPGAADCAHRALLHAPRRLPVDAHRLDLQGNNISIIFQSDFQNLKELKILQLSENQIHTIERDAFLELNVLERLKLSNNRLGHIPDGIFLRLRHLQRLDLSRNELTAISRRTFRGLTALKSLHLDGNQLKCIDEKALEHLKSLEVLTLNNNNLTYLSLEAVSVARLHTLRLSDNPIVCDCRVARLAAAVRAAGILGLGARCQAPATLRGAMLTELEAQDLICNGPNSIAECSSEPRCPPACRCSTDGTVDCREKLLTELPTTIPHRATEIRLEQNEITEVGAGAFSAVKRVARIDLSNNKIAKMAGDAFNGLTHLTSLVLYGNKIKDLPSGIFHGLTSLQLLLLNSNEISCVRKDTFRDLQSLKLLSLYDNNIRSLPNGTFDSLTGIQTLHLGRNPFSCDCSLRWLGAYLRRNPIETSGAKCDSPKRMNRKRIDALRDENFKCKPGEEPPDACGDAPPCPDTCACSGAGRALRVACARAGLADVPRDLPLTTHALIMPDNNLGQIKSDGLFGRLPDLAKLDLRNNGITVIEDNAFDGAVAMRELSLDGNLLQTVGDKMFFGLHSLTLLSLTDNKIRCITPGSFDHLTMLSTLSLANNPIACNCHMSWLPGWLRGRRLSSGVTCALPLGLRGTELQQLEVVDFKCAPDEQGCLPADYCPERCACAGTVVRCARARLTSLPPRIPPYTTELDLSRNELTAISRRTFRGLTALKSLHLDGNQLKCIDEKALEHLKSLEVLTLNNNNLTYLSLEAVSVARLHTLRLSDNPIVCDCRVARLAAAVRAAGILGLGARCQAPATLRGAMLTELEAQDLICNGPNSIAECSSEPRCPPACRCSTDGTVDCREKLLTELPTTIPHRATEIRLEQNEITEVGAGAFSAVKRVARIDLSNNKIAKMAGDAFNGLTHLTSLVLYGNKIKDLPSGIFHGLTSLQLLLLNSNEISCVRKDTFRDLQSLKLLSLYDNNIRSLPNGTFDSLTGIQTLHLGRNPFSCDCSLRWLGAYLRRNPIETSGAKCDSPKRMNRKRIDALRDENFKCKPGEEPPDACGDAPPCPDTCACSGAGRALRVACARAGLADVPRDLPLTTHALIMPDNNLGQIKSDGLFGRLPDLAKLDLRNNGITVIEDNAFDGAVAMRELSLDGNLLQTVGDKMFFGLHSLTLLSLTDNKIRCITPGSFDHLTMLSTLSLANNPIACNCHMSWLPGWLRGRRLSSGVTCALPLGLRGTELQQLEVVDFKCAPDEQGCLPADYCPERCACAGTVVRCARARLTSLPPRIPPYTTELYLESNEITSISSEQVRHLTQLTRLDLSNNRIAVLSNNTFEGLSKLSTLIVSYNRLRCVQRDALKGLTQLRVLSLHGNNISTLADGVFRDLESISHVALGSNPLYCDCSARWLSEWVKVSGEYVEAGIARCVAPPPMRDKLLLSTATSAFVCNGNPPPEVVSKCDRCYRNPCLNQGTCRSTTSGGFACSCARGFHGETCQYEIDACYGSPCAQGTCQLLEEGRFHCACHAGYTGVRCEVDIDDCVGHRCKNNATCVDHLEGYTCKCAPGFMGEFCEKKIPFCTSGFNPCANGASCVDLGSHYTCACPKGYSGQNCTINADDCMNHMCQNGATCMDGLDEYRCACAAGYAGRYCEAAPHAALGTSPCAHHDCVHGVCYLPALALHDDIMMERPLLAPPDYLCKCAPGYSGRYCEYLTSLTFNHNDSLVELEPLRTSPQANVTLVFSTKQLHGVLMYFGDNEHLAVELFNGRIRVSYDVGNHPTSTMYSFEMVSDGNYHKAELLAIKKNFTLRVDDGPARSIINEGSNEFLRLERPMFVGGVPPDVAKDAFSKWHLRNITSFKGCLKEAWINHKRVDFVNAARATRTTAGCGGGGLAGPGAEEPPAPPHALQEDGAHEPDPCVPNPCARGGRCVREAGSRSDYTCRCRAGTAGAQCERRASVGGTPVITQSKLPPRKQVINNNNVQASPAAPSPKQYPDQASAPQMPSTAACRKEATREFITEGSCRSRRPVRGARCTARTVGPGDSGGACPRATCCAPRKTKKRKIRLVCSDGTRYTKDIEIVRKCACGKKCPARNTPFLH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: