MonarchBase - Protein-coding gene

DPOGS208547
Transcript	DPOGS208547-TA	3786 bp
Protein	DPOGS208547-PA	1261 aa
Genomic position	DPSCF300064 + 995454-1010128
RNAseq coverage	896x (Rank: top 14%)

Annotation
*Heliconius*	HMEL008765	68.07%
*Bombyx*	BGIBMGA010335-TA	66.16%
*Drosophila*	ed-PA	48.84%
EBI UniRef50	UniRef50_Q9BN17	48.84%	Echinoid n=20 Tax=Diptera RepID=Q9BN17_DROME
NCBI RefSeq	XP_002087894.1	48.91%	GE18270 [Drosophila yakuba]
NCBI nr blastp	gi\|270013632	54.52%	hypothetical protein TcasGA2_TC012257 [Tribolium castaneum]
NCBI nr blastx	gi\|270013632	54.52%	hypothetical protein TcasGA2_TC012257 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.5e-10	protein binding
KEGG pathway	cfa:403440	3e-29
	K06255 (HSPG2)	maps->	ECM-receptor interaction
InterPro domain	[657-731] IPR013783	1.1e-23	Immunoglobulin-like fold
	[724-860] IPR008957	8.1e-19	Fibronectin type III domain
	[741-835] IPR003961	1.5e-10	Fibronectin, type III
	[155-236] IPR013162	2e-09	CD80-like, immunoglobulin C2-set
	[644-733] IPR013098	5.3e-09	Immunoglobulin I-set
	[343-426] IPR003599	1.3e-08	Immunoglobulin subtype
	[349-408] IPR003598	1.5e-06	Immunoglobulin subtype 2
Orthology group	MCL11173		Insect specific

Nucleotide sequence:

>DPOGS208547-TA
ATGATAAAAAGGCATGTCGTCCGCAGTCCACGGGCTGGCTGCGCGTGCGACGACTCACTAACTCGACCCCACGTGTCATTGAACCCGCTTCTAGTCGACTACGTTATACTGACAATCCTGTGCGAGGACGAGCAGCACGATTCTAGGGAGGGTGACGATGTGTCGATGCAGTGTCGTTTCGACTTGGAGCCCGTGGCTGGAGAGTCTCTCACGTACTACTGGGTCAGGAGCACCTCCAGCGGTCATGACAATGTTGCCATCGGTAACATACCCCTGGAGACTAACTACCAGATAAACTACGCTCCATCGGAAGGTAAGTTCGACTTGCTGGTGTCCAATGTGACATACGAGCGTGACAACGGTCGGTTCGAGTGTCGAGTTAAGGCGGGCGGGTCGGGGCGGACGTTACATTCTCAAGGACATAGTCTGGTGGTCCTCACACAGCCCCAGCCTCCGATCCTCAACCCTGGACCTCAGGCCCAAGCGCAGGAAGGCAGGCAACTCAACCTGACATGCTCCAGCACCGGCGGATCCCCCAGTCCGTATATAAAATGGTACCGAGATGGTTCCATCCATCCCTTAGATGCTGAACTCATACCGGGTAAGACTCGCTTCGAGCCAACGTTATCAATACTGACGTTGGAACCAAATAGAGACGACAATGGAGCGACATTCCGCTGTGTCGTGAGGAACAGGGCCATGAAGGAGGGGAACCAGCTCGAGGCCACTGTTGAACTTAGTGTTAACTATTTCCCCCGCGTTGAAGTCGGTCCCGAAAATCCTTTGCGAGTCGAGATCGATGGGAACGCTAACATGGTGTGCAAGGTTGACGCCAAACCTAAAGTAAACACAGTCAGGTGGACGCGAGATGGGAAATATATATCAAACTCGTTCACACATCTGATACAAGGAGTGACCGTACAGGACGCGGGCAAATACATCTGCAGCGCTGACAACGGACTCGGACAGCCCGGAGAAAATGAGATATACTTGGACGTCCTGTATCCTCCCAGCGTCACAGTCGATTCGAAAACATACGAAGCCGAAGAAGGTGGCAACGTTGAAATAAGATGCGAAGTCTCCTCCAACCCCGACCCTATATCCATCGAATGGACCAAGGAAGGACGAACTGATTTCAGACAGAAAGGGAATACGTTAGTACTGACTCGAGTCGACGCCGACATGGCCGGAACTTACGTGTGTCGGGCCGTGAACGTGATCGCTACCAGTAGTGGTAATAAAGTGGAGAAAGCCGGCATGGCGTCCGTGGCTGTGCTCGTGAGACATAAGCCCGGACGAGCCTACATAAGTCCAGACCATCCGATAGCCCAAGAAGGTACCGGGGTTACATTGACCTGCAGCGCCAAGCCCCCCGGCTGGCCTGTACCGCAATATCGCTGGTTCCGCGAGATAGAAACGGTTGACATCAAACCTACGGTGTTGGCGACGGGGAACAAGTATACAATACCCAGCGCTCACCTGGGTAGCGAAGGCGTGTATCATTGTCAAGCTACGAACGAGCTCGGTCACAGCGAGCTGGCCACCGTCAACCTGGAAGTGTATCAGCCGCCTAGATTCCAGTCAAAGCTGCAACCTCACATGATAAAAAACTCAGGTGAAAGGAACTTCTCTCTCACATGCGTCGCTCTGGGCAAACCTCTCCCTAGCGTCAAATGGTACAAGGACAACTCGGAGATCCGACCCGACGCCAACATGTACGAGGTGAAGACCGAAATTAATAAGAGCAGCAACGCCGTCTACAACATACAGAGCGTTCTCAGATTCCACGGAAGGGCGAGGCCCAGCGGCGACGACCTGCTTCCTGCTGATAGAGGTGTCTATTCTTGCTCCTTTGAGAACGAAGTCAAGAAAGTGGAATCGTCGATGCAACTACGTATTGAACATGAGCCGTTATCGATCAAACAACAGCGGAAGGTGGCGTACGATTTGATGGAGAACGCTGAGATATCGTGTCGAGTGTTGGCGTACCCCAAACCCGAGTTCCAGTGGTACTACAGCATGAACCCCTCCCCGCTGCAGATGTCCTCGGACGGCCATTACGAGATTATAACGACGACCGACGAAAACGACTCGTACTTGAGCGTTCTCATCATTAGAAATATAAAGTCACAGGACTACGGCGACTACTACTGCAACGTTAAGAACACGCTGGGCGGAATACGGCCGCAGATCAGGTTACAGCCCAAGGGCGCGCCCGAACCGCCCAAGAACCTGTCTAGTCAGAAGGTTGACGCGACCTACGTCACCTTGAAGTGGGAGGAGGGTTTCAACGGCGGTCTGTCCAGTACGAAGTACTTCGTACTGTATCGAAGAGTCAGATCCATCAATGGCGAGCCGTGCGCGGTGCAGGGCGCCGACGAGTTCGACTGGAAGGAGTACGATTGCGGCCGGGCGAACCCCTGCAACGTCACCAGGCTAGAGCAACACAACTCCTACTACTTTAAGGTGAAGGCGGTCAATACTAAGGGTCAGAGTAACTATTCCAATGAAATTTCGGTGACGACGAGGGTTGATAAGATATTACCGCCGGAACAGGTATCTTATGACCCCAGGTCTAGTGTCGTGGGCTTCAGGGTGGGACCTACATGTCTCCCGCTTATGGGAGTCATCGAAAATTTGGTTGCCGATGGATGGAAGGTGATAGAAACTATGCCTCTTCGTCTGTCGGGAGTCGTGTCATCGGAACAGGATACGACATTGGATCAAGTGACCGTCGGCGGCCGAGGCGAGAGGAACTCTTACGACCCTAACATACGACTCAGGCTGAAACTGTGCCTACAGAACAACCAAAACGTCTGCAGCGAGTATGTTGAAGCTAAGATCGGTCCATCGATCACCAAAGAAGCGGTCGCCCTCACCACCGGCACCATGATAGCGCTGATCATATCCTGCGTGCTGATCGTCATGGGTTTCATACTCTTCGGCTTGTACTGTCGATGTAAATGTAAGGAGAAAAACAAGGGCTCGTCCAAAAATTATGTCGTAGAGGCCAAACGATCGCCCGTCGACTCGCCCAGGAACCATCCTCCCCCGCCCTACTACCCCACCACCGGCATGGAAAACAAGGCTCTGGAGAGTTCCATGGACGTGCCATCGATCATGGAAGACTCGAAGTACTCCTCGCAACCATACGGCTACCACATGCCCGCTCAGGACATACCGCCCACAGACTGGAACATCCAGTATCTAGAGAACAATTACGCCAACAGCAACAACGGCGGCAGTGTCAACTCCCAGGACTCGCTGTGGCAGCTGAAGATGGTCGCCGCCAACAACTCCTCGGGCATGTGTCACCCCATCATGACCTCCGACAGGCAGAGCAACTATGGCTACGACCCGATCAGACACGGCGGCTACGGCACCATCGATGACTACGCGCCCTATCCGCCGCTGCCGCTGGCACCGCACGGCCAGCACGGGCAGCTCGGCCAGCACGGCCAGCACGGCCAGCTGGCACCCCACGGCCAACACGCGCCACTAGCGCCGCACTCGTCCCACGGCCCGGGCTCGGATTACGCTCGCAACTCCCAGAACCCATCCAGACAAGACTACTGCTCGGACCCCTACGCCTCCGTTCACAAGCCCAAGAAACGGATGGATCAACATATCGAGTCCCCGTACCACGAAGTGAGCGGTCTGCCGGAGTTCCCCGAGGCGGCGGACGACAAGCCGGCGCTGTCCCTCAGCTACGACGAGTCCCTGGAGTCCGGGTACTCCACACCCAACTCACGCGCCCGCCGGGTCATCAGAGAGATCATCGTGTGA

Protein sequence:

>DPOGS208547-PA
MIKRHVVRSPRAGCACDDSLTRPHVSLNPLLVDYVILTILCEDEQHDSREGDDVSMQCRFDLEPVAGESLTYYWVRSTSSGHDNVAIGNIPLETNYQINYAPSEGKFDLLVSNVTYERDNGRFECRVKAGGSGRTLHSQGHSLVVLTQPQPPILNPGPQAQAQEGRQLNLTCSSTGGSPSPYIKWYRDGSIHPLDAELIPGKTRFEPTLSILTLEPNRDDNGATFRCVVRNRAMKEGNQLEATVELSVNYFPRVEVGPENPLRVEIDGNANMVCKVDAKPKVNTVRWTRDGKYISNSFTHLIQGVTVQDAGKYICSADNGLGQPGENEIYLDVLYPPSVTVDSKTYEAEEGGNVEIRCEVSSNPDPISIEWTKEGRTDFRQKGNTLVLTRVDADMAGTYVCRAVNVIATSSGNKVEKAGMASVAVLVRHKPGRAYISPDHPIAQEGTGVTLTCSAKPPGWPVPQYRWFREIETVDIKPTVLATGNKYTIPSAHLGSEGVYHCQATNELGHSELATVNLEVYQPPRFQSKLQPHMIKNSGERNFSLTCVALGKPLPSVKWYKDNSEIRPDANMYEVKTEINKSSNAVYNIQSVLRFHGRARPSGDDLLPADRGVYSCSFENEVKKVESSMQLRIEHEPLSIKQQRKVAYDLMENAEISCRVLAYPKPEFQWYYSMNPSPLQMSSDGHYEIITTTDENDSYLSVLIIRNIKSQDYGDYYCNVKNTLGGIRPQIRLQPKGAPEPPKNLSSQKVDATYVTLKWEEGFNGGLSSTKYFVLYRRVRSINGEPCAVQGADEFDWKEYDCGRANPCNVTRLEQHNSYYFKVKAVNTKGQSNYSNEISVTTRVDKILPPEQVSYDPRSSVVGFRVGPTCLPLMGVIENLVADGWKVIETMPLRLSGVVSSEQDTTLDQVTVGGRGERNSYDPNIRLRLKLCLQNNQNVCSEYVEAKIGPSITKEAVALTTGTMIALIISCVLIVMGFILFGLYCRCKCKEKNKGSSKNYVVEAKRSPVDSPRNHPPPPYYPTTGMENKALESSMDVPSIMEDSKYSSQPYGYHMPAQDIPPTDWNIQYLENNYANSNNGGSVNSQDSLWQLKMVAANNSSGMCHPIMTSDRQSNYGYDPIRHGGYGTIDDYAPYPPLPLAPHGQHGQLGQHGQHGQLAPHGQHAPLAPHSSHGPGSDYARNSQNPSRQDYCSDPYASVHKPKKRMDQHIESPYHEVSGLPEFPEAADDKPALSLSYDESLESGYSTPNSRARRVIREIIV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: