MonarchBase - Protein-coding gene

DPOGS203712
Transcript	DPOGS203712-TA	3267 bp
Protein	DPOGS203712-PA	1088 aa
Genomic position	DPSCF300010 - 1413144-1420003
RNAseq coverage	133x (Rank: top 56%)

Annotation
*Heliconius*	HMEL002390	0.0	81.74%
*Bombyx*	BGIBMGA003498-TA	0.0	81.06%
*Drosophila*	CG32354-PA	5e-21	24.04%
EBI UniRef50	UniRef50_D6W6H4	0.0	54.23%	Putative uncharacterized protein n=3 Tax=Tribolium castaneum RepID=D6W6H4_TRICA
NCBI RefSeq	XP_001811978.1	0.0	54.29%	PREDICTED: similar to agrin [Tribolium castaneum]
NCBI nr blastp	gi\|189233617	0.0	54.29%	PREDICTED: similar to agrin [Tribolium castaneum]
NCBI nr blastx	gi\|270014663	0.0	54.29%	hypothetical protein TcasGA2_TC004709 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	3.2e-18	protein binding
KEGG pathway	tca:100141763	0.0
	K06254 (AGRN)	maps->	ECM-receptor interaction
InterPro domain	[905-1077] IPR008985	4.8e-21	Concanavalin A-like lectin/glucanase
	[127-172] IPR002350	3.2e-18	Proteinase inhibitor I1, Kazal
	[909-1060] IPR013320	7.3e-15	Concanavalin A-like lectin/glucanase, subgroup
	[132-172] IPR011497	6.1e-12	Protease inhibitor, Kazal-type
	[658-707] IPR002049	2.4e-11	EGF-like, laminin
	[943-1057] IPR012680	3.4e-08	Laminin G, subdomain 2
Orthology group	MCL11844		Patchy

Nucleotide sequence:

>DPOGS203712-TA
ATGCTAACTTCACCGAATGCGATTTTATTAATGGTCCCTAATATATTGGGATGCTATATTTTTCCGAATGACGTGACGAATCCGTGTCGAGGCGTGATCTGCGGCCCAGGAGAGCTGTGTCGCCCTACTGCAGACGGAAAGAATTACAGTTGTGAATGTCCAACATCTTGTCCAAGTTACGGGGATCATGAAGGTTCACGCCCCTTATGCGCTAGCGACGCTAAAGATTATCCCGGAACATGTGAAATGCGAAGAGCTGCTTGCGAGAGCAACACAAACATAACTTTTAAATATCATGGCAAATGTGACCCCTGCGCCGGCGTATCCTGTCCAGATCCAGAAGTTTGCCAATTGGATGACCAACGCCAACCTTCCTGTCGCTGCGCAGAACCTTGTCCTTTAGAATTTTCCCCTGTATGTGCGTCTGATGGAAAGACTTATTCGAACGAGTGTCAAATGCATAGAGAGTCCTGTCGAGCCAGAAAACAATTAAAGATTATTTTTAAAGGACAATGTATTTCAGGTGTAAACCCATGTGCGGAGGTGGAGTGTCGTCACGGCGCTGAATGTCGTGTGGAGGGTAGTGGCGCGGTCTGCGCTTGTCCGCCCCCCTGTGAACAAGTGCTGCGACCTGTCTGCGGTTCTGATGCGAGGACCCATGACAGCGAATGTGAACTTCGACGTGCTGGCTGTTTGTTAGGAAGAGAGTTGAAGGTCGTTCACGCTGGAGCCTGCGGTTCCAACGGTGTTTGTGCTGGGCGGGTATGCCCTCACGGTGGTGAATGTGTTTCCTCAGGAGGTCGAGGCGTTTGTCGATGTCCAAAATGTTCTAATGAATTTGCTCCCGTGTGTGGTTCTGATGGTATTTCCTACGGCAACAGATGCAAGCTGCAGTTAGAGTCCTGTAGACATCGTCGTCACGTTCAAGTGTTGTACGATGGACCTTGCAATGGATGTGAAAATAAAAAGTGTGAATATTATGCCGTTTGCGAGAGTGATGGTGTTTCTGAAGCTAGCTGCGTTTGTCCAAAACATTGTGAAGAAGGAACTGAAACTGAAGAAGTTTGCGGTAATGACAACAAAACTTATAGCAGCGTTTGTGCTCTTCGTAACATAGCCTGCCGCGAAAAGAGGAGACTCCACGTTAAACATATGGGTTCTTGTGAATCTTGCGGCAATGTCGAATGTCCGCTAGGTATGTGGTGTTCTCGAGGCAAATGTGCTTGTGCAAGTTGTGCTGATGTTCCTCGAGAGACCGTTTGTTCTGACACGAGGCGAACGTTCCCCAACGAGTGTTCATTGCATAAAGCTGCGTGCGAGGCGCGAGCCCGCGGGGAACCTCCTCCGCAGGTTGCTTACTATGGAGACTGTACTGATGCTAATAAAGATAATAGTTCAGGGGCTAATGTATCAGAGAAAATGGAACAGAGTAATGAGATACGGAATGGTGTGGAGGTCGACAGTACCAGTGAACCATCTGTTGGAACAGCTGTTTGTGCTAGAGTGCAATGCGCCTACGAGGCGACCTGCGCTGTGGACGGTAACGGCCAGCCACGTTGTGCATGTCTGTTTGACTGCGCCGCTGCGGCAGCTTCTTCCTCAGCGCCCGTCTGCGCCTCCGACTTACGCATGTACCCCACGCTGTGTCATATGAAACTGGAGTCTTGTCGCCGTCAAGAGGACCTTCGACTGAGGCCTTTAGCATTGTGTAGGGGTCTCGAGTTCAGGCCATGTGGTGATGATGAAACCGTAACAGATTCGGAAGGTCTTCCAGTTGATTGTGGCGGTGGACCTCATCGTAAGGACTGTCCGACGGATAGCTACTGCCATCATACTGCTAAGGCTGCAAGATGTTGTAGGAAAGACAAAGCTGTCGCAGAGAAGAAAGACTGTCAAGAATCTTGGTACGGCTGTTGTGCGGACGGGGTGACGTCAGCACGTGGTCCCGGGGGGGCGGGATGTCCCTCACAATGTGGTTGTCACAGGCTGGGTTCTGTGTCCGAGATGTGTGATGAAAGCGGCCAGTGTCAATGTAGACCTGGTGTGGGAGGGCACAAATGTGACAGATGCGAACCAGGTTATTGGGGCTTACCCCGGATCGGTACTGGACATACTGGCTGTATACCATGTGGGTGTTCGGCCTTCGGATCAGTTCGTGAGGACTGCGAACAGATGACCGGGCGGTGTGTTTGCAAACCGGGCATTCAGGGGCAGAAGTGTACTGTTTGTTCCAACCATGAACATACTCTAGGACCTAACGGCTGCTTTGACCCGGAATCCACCCAACTACCAGCTACCGACTGTGAACGTATGACATGTTATTTCGGAGCCTACTGCGCTATACGTAGCGGTCTTGCCACTTGTGAATGTAATGCTCAGGAATGTTTTACAACCGAGGGCCCGTCTGTTTGCGGTAGTGACGGACGGACATATCTATCAGCTTGTCATGCGAGGGCGCACGCTTGTCGGACACAATCGGACATAGTTGTACAGGCGTTTGGTCCCTGTGCTGAAGATACGCCGTCTGTGAAGCGAGAGGAAATAAATTCATCTATTATTTCGAAAGAAAATGCCGAAGAAGGTTATTGTAACAAAAACCCATCTCAAATAGATACCGATATTGAAGTTACAGAATCGGAGGAAGAGCAATACATAACAAATGAGGTTGAAGAAAATTATCCAATATACGAAGAATACATCGAGGAAAACGAAAACGAAATATACTCATCGCCATTGTTCGACGGGCATGCTCGGATGACAGCTCGCACAAGATTGCCCGCTAAACGATTCGATATTTGGGCCGAAGTATCGGCGGTGTGCGGTAAAGGCGCTTTAATAAGTGCCTCAGGTGTGCGAGATTATTTATGGCTCGGGTTCGTAAAAGACAGAGCTGTATTGCGTTGGGACGCTGGCAATGGCCCTTTAGAGTTACGATCTGGTAAAATAAGAGTTGATACTAAGTCTAAAATATCGGCGCGGCGATATAAGAAGGACGCCATGTTGAAACTTGAATCTTATACAGTTAGGGGTACGACACATGGACGCATGAGTTCATTAGACGTTGATCCTTATATTTATATTGGCCATCCGCCGGATAACGTTACAAAGTTATCTGGTGTACACACAATGAACGGTTTTGTGGGATGTGTACATCGCTTGCGTGTGAGCGGACGTGACGTCATCCCCCCGTCCCGAGGCCTAAATATTGTGGCTCATGGTCTGCGACCATGCACTCCTTACAATCTAGCCAAGGTCGTGTGTCCTTAG

Protein sequence:

>DPOGS203712-PA
MLTSPNAILLMVPNILGCYIFPNDVTNPCRGVICGPGELCRPTADGKNYSCECPTSCPSYGDHEGSRPLCASDAKDYPGTCEMRRAACESNTNITFKYHGKCDPCAGVSCPDPEVCQLDDQRQPSCRCAEPCPLEFSPVCASDGKTYSNECQMHRESCRARKQLKIIFKGQCISGVNPCAEVECRHGAECRVEGSGAVCACPPPCEQVLRPVCGSDARTHDSECELRRAGCLLGRELKVVHAGACGSNGVCAGRVCPHGGECVSSGGRGVCRCPKCSNEFAPVCGSDGISYGNRCKLQLESCRHRRHVQVLYDGPCNGCENKKCEYYAVCESDGVSEASCVCPKHCEEGTETEEVCGNDNKTYSSVCALRNIACREKRRLHVKHMGSCESCGNVECPLGMWCSRGKCACASCADVPRETVCSDTRRTFPNECSLHKAACEARARGEPPPQVAYYGDCTDANKDNSSGANVSEKMEQSNEIRNGVEVDSTSEPSVGTAVCARVQCAYEATCAVDGNGQPRCACLFDCAAAAASSSAPVCASDLRMYPTLCHMKLESCRRQEDLRLRPLALCRGLEFRPCGDDETVTDSEGLPVDCGGGPHRKDCPTDSYCHHTAKAARCCRKDKAVAEKKDCQESWYGCCADGVTSARGPGGAGCPSQCGCHRLGSVSEMCDESGQCQCRPGVGGHKCDRCEPGYWGLPRIGTGHTGCIPCGCSAFGSVREDCEQMTGRCVCKPGIQGQKCTVCSNHEHTLGPNGCFDPESTQLPATDCERMTCYFGAYCAIRSGLATCECNAQECFTTEGPSVCGSDGRTYLSACHARAHACRTQSDIVVQAFGPCAEDTPSVKREEINSSIISKENAEEGYCNKNPSQIDTDIEVTESEEEQYITNEVEENYPIYEEYIEENENEIYSSPLFDGHARMTARTRLPAKRFDIWAEVSAVCGKGALISASGVRDYLWLGFVKDRAVLRWDAGNGPLELRSGKIRVDTKSKISARRYKKDAMLKLESYTVRGTTHGRMSSLDVDPYIYIGHPPDNVTKLSGVHTMNGFVGCVHRLRVSGRDVIPPSRGLNIVAHGLRPCTPYNLAKVVCP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: