MonarchBase - Protein-coding gene

DPOGS203692
Transcript	DPOGS203692-TA	4647 bp
Protein	DPOGS203692-PA	1548 aa
Genomic position	DPSCF300010 - 1972485-1995932
RNAseq coverage	245x (Rank: top 42%)

Annotation
*Heliconius*	HMEL013312	0.0	64.55%
*Bombyx*	BGIBMGA003486-TA	0.0	56.44%
*Drosophila*	bbg-PC	2e-23	44.20%
EBI UniRef50	UniRef50_UPI0002246D24	5e-38	42.33%	UPI0002246D24 related cluster n=1 Tax=unknown RepID=UPI0002246D24
NCBI RefSeq	XP_001606112.1	5e-39	42.33%	PREDICTED: similar to prIL-16 [Nasonia vitripennis]
NCBI nr blastp	gi\|345487742	2e-37	42.33%	PREDICTED: hypothetical protein LOC100122506 [Nasonia vitripennis]
NCBI nr blastx	gi\|270014802	7e-116	27.61%	hypothetical protein TcasGA2_TC010783 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	3.8e-19	protein binding
KEGG pathway	dre:368723	6e-16
	K06092 (INADL, PATJ)	maps->	Tight junction
InterPro domain	[1326-1441] IPR001478	3.8e-19	PDZ/DHR/GLGF
Orthology group	MCL22032		Lepidoptera specific

Nucleotide sequence:

>DPOGS203692-TA
ATGCGTCATATGTGTACAATACAGACCAGCCCAGAAGCAGTGATTAGAACTGCAGGGCCAAGTTTGGTATGCGGCATGGAGGCAGACGCGGCTGTCGAAGAGTTTGTCACAATAGTGCCGGTTGGGGAAAATAGTACTGTTGTACAGGATCCAGAATTTGTTACAGTGCTCAACGTCAGTGTGACAAAAGGCGGCGCTGAAGTTATTGTAAACAGACCACGTGGTGCTCGATTAGGTCTAGGACTAAAGTTTGAAGGTGGATCAGCTGCAACAGAGAAAGTTCGAAGACTTTTAGTACAATCATGTGCGGAAGATAGTCCTGCTGCGAATGCGTGTACTCCTTGGGGTAAATTGATATCAGGGGATGAAATTTTAGCTATAGATGGGACTCCAGTATCTGAATTAACAAGAATCGAATGTGTACGTCGTTTAAAAGATTCAGATGAAAGTTTAATTCTTCTTGTCAGACATTTTGAAACATTGGATAAAGTAGATCAGCAAAATATGGAAACAAAAGAAACAGTGATGACTGACTCGAAAACTTTTGTTGATATATCAAGACCTCTGACTTTACCTCCCCCCGTCCCTCCGAGGAAATTGGGTAAGAAAAATTCCTTTAAGGATAAAACAACCCTTCAAACTGTGGGTGAACAGAACGCTCTCATGAATTTAAATCTGTCTGACACTGGTAACGATAAAGATAGTATTATAAGTGCATTAGTCCACCAACATTCGATGGTTTCAACTATGAATAAATTATCACGGAAATCGTCTTTTGATAGCCATATACATCGTCAAACCAAGGAAAGTTTTGCACACTTAAAAAAAGGTTCTCCTGAAGAAGTGAGGCGTCTAGTACGTCGACTATCAGACGGCAAAACGATACCACCAGAAGCTGAAGTTTATATTGATTTACTTTCGAATGAGTGGGAACGCTGTCTTGTATTAGCAGATGCTGAATCAGACGATACTGGTAGTTCTATATCTACTGTAGTCGATAGACTAGGATCTATGGCTAGTTCTGTAGAGAATAGTATTCCTTCAACTCCAGTTATGCAACAGAAATCAATTGATATTCAAAAGGTACTCAATAGCATTGAAAATATAGATTCTGATATATTAAAAGACATGACGAACGTGAAATATTCTGAAACTAAAGTAGATAGAAATGATGATCTTAAAAGATGTTTAAGAAATTCTATGACAAATGGACAAAAAGTGTCTAATACAAATTCAAACATAGTTACAGAAAATATAAAACCAAAACAATGTGAAAACGATAACAATAACAACGAAACATCTAAAACTTTGGCACCAAACGATACGTTTGCGATAAATGACAAGAAAATGAAGGAGGATGTAGTGCTCGATAAACCTAAACCAATGCCACGCAGCACTAAAGTGGAACGTTCTGCAAGTGAAAAGAAACGTCGTCCTGTTCCAATACCAGAAGTACAGCCTCCTAATATTTCGGAACCACTTTTAACACCTACAAAGAAAACATGTATTGAATCGTGGTTACAGCGCTCAGAAGCTGAAATGCAGAATACCTCGACAGAAAAAATAGAGGAAACTACTATTCCTGAAGCATTACCACGTCTTATTGACTTTGTCCCCAAGAATCAGTACAAAGAAAAAAGCAACGAATCTCCAACATGTGTTAGACCTACAACGGCTCCTCCTCCACCACCCGTACCTCCACCAGAAACCAGAGAAGATGGATCGGGAGCATCACTTGATACAATTGGTGAACTTGATGAAACCTGCGACGTTGTAGACAACGCGAAACAAACGAAGGATATTGAAACGAATAAAAGAAAATCACATTACGAGAGAAACTTCTGGGATGATCGAGTTAATAGAAGTGATGCCGAAGACAAAAGCCTTTCTAATGATGAAACTCCATTGCCTTCTTGTCCTCGACAACCTCCCGATGGAGTAGAGACACCTTCTGATGTTGTTGAAAAAGTCCCAGACCTCCCTACAAGATTACCTCCAACTACTTGGATAAGTACTCGCTCTAGATACTCATATGCATCTCGGACTCAAGACGCCAGAAGTGAAGCAAGTGTTAAAGATAAAATTGCGATGTTCTCTGTTGACCTCGCTGCGTCATCAGATCGATTGGATAAATGTGGTACGTTACCGGCCAGATCACATTCAACAGTAAGAAAAAATGCGCCTTCTTTTAAAAATGATTACACAGAGATATCATCCTTGGATCGACGTCTTACAAAGTCTCAAGATAATTTGGATGAGACACCTCGCTCATATAAACGGAACTTAGACAGACCTGAGGTACTTGGGGCTTTGGAAAACTCACATATCGAAAAGAAAGGTTATAGGTCAAAGCCATCAGATATGTTCGGTAAACCCTTATTCTATGGGAGTACGACTACTTTGCCTACAAATATATCACCTAATAAATCTATTTATCATGCACGTAGTATAAGTGATGATAACAGCAACAAAAACTCTGCTTCACATAAATCTAATCTCGAGTATTTGATAGAGCAAAGAAAGAAGTCAATGTCAAAGTTGCGTGGTTTAGTAATACCTGAAGTTCAAGCCCCTATTGTAGACTTGCCTGAAATTAAGGTCAAGGATCCACCACCAAAAACTTTACTTCATAATTTCTCACAGATCCAAACAACAAAAGAAAGTAAAAGCGGTTCTAAAAATCCCTTATTTGTGTCAGAAAATAAGTGGAATACCAGCTTTTTAACAAATAATATACCAAAATATTCACCAGCATTCAAACGAAAATTTCTACAAGTTTATACGCCTTCTCTATCGAAGGAAACAACTCCAGAGAGAAAATTGCCTTCAAAGGTAGACACAAATGAAAGAATTATAAACAATTATAACAATTCTTTTTCGTCTAAACCTGCTAGGATTACACAAGAATACCCGAAACCCACGAACAAGTCCACGCAATTGTTAAATAAAGAATTCTATAAAATTAACTCCAATGATAAAAATAATGATTTTAAAAATTATGAAATACGAATTTGCACTACTACAGATGTTGTGGATAGTGATAACGATTCTGCCATGAGTTCTACTCAATCAAGCTATCGTTCTTCAGCTTCTTCACCTATGCATAATATGGACCACTTAGAGTCAGATAGCTCACGATTGTCTCCCAAACTTTCACACTACAATTCGTATTCCATAGTAAAGACAGAAATCCCGAATAAGTTACTACCTATCTCTCAAAAGAACTATGAGGAATATAGCAAAAGAAAAGTTTGCCGATCTATGTCTTCGGACACAAATATTTCCCTTAGTTCTTCTGCAGGTTCTGCTGCTACATCAGGATCACAAGCAAGTTGTAGCTCTCTTGAAAGTTCTGTGGCTGACTCAGATAAGAGAAAAGTTTCAACAATATATAATGTGGATACAATAAATCGAAGAAACATTGTAGCTTCTTCAAAGTGTAGAAGCGGAAGAGACGTAACGCTTACGTCCCCAGTTATTGAAACTAAGTTCTCGCATGAGTCCTACAACAGATCTCCTAGTCCAACACACAAACCGTCTGATCGCCTTTCGACGCTCACATCAACAGTGAGCGCTGTAGCGAATAAAGGTGAAAACAGACGACGTAATAAAAAAATTGTTTCTGATTCTGATTCTGATAATGAAGAAAATATCAGACAGCGCAAACCTGACTATAAGAATACAAGATTAAAACGTAATTCTAGTACAACGAATAAAAATAATAAATATAGTGACAATGTCCAGGTAACAGAAGTAATAGAAAAGGAATCTGTTTTAAAAGAAAAAGTTTCAAAAGGAAAAGATTGTAATAACGAAATTCAGGATAATCAGAAAGATTTAGACAAAAATAAATCTGAAGTAATCAACACTACGGGTCTTACGAAAATTGAAAAGGACAAAGAAAAAAGAAATGGAATTACACCCAAAAAAGACGTTCCTGTAAAGTTGCAAAATGTTAAACCTGTATCTATCCCTGTGATAAATTCTAATAATGTGCAAGAGAAACCAGTGAAGGTGACTACACAAGTAATACGTCTTATAAAGGGAGCTGGTTCTGGGGTTGGTCTTATATTAGCCGGTGGAATTGATTGTGAGGCTAAGGATGTAACAGTACATCGTGTGCTAGAGGATAGTATAGCAGCAAAAGCTGGGATAAAGAGGGGATCAAAAATTCAAAGTATAAACGGCAATGCTATGAGCGGAATGACCCACGCTCAGTCCGTAAAGGTGTTAAAGGAACAGCGTTCAGAAGTCATCATAGAAATAGAACTTCCGGATAACAGAACTCTTAAAGACTGCGGCTCTCAACATTCGGAGTCGAAAGGGCAACAGGGAATGGACGGAACAAAATTCCGCAACAATTCAGGCCGTTCAATTGTGACTGTTATATTAGAAAAAGCCGGGGGTGGTGCTGGATTGGGTTTTGGCCTAGATGGAGGAAGAGATTCTCCTCAAGGAGACAAACCTTTGACTATAAAAAAACTGTTCGCCGGAGGTGCGGCTGCTCAAAGTGGGAAAGTTTTGGTTGGCGCAGAACTGCTCTCTGCTGGTGGTCAAGCTATGGAGGGATTTACTCGTACTCAAGCGTGGGCTGCTCTTAAAGCCTTACCAGCCGGTCAAGTGACTTTAGTGTTACGGAACCCGTAA

Protein sequence:

>DPOGS203692-PA
MRHMCTIQTSPEAVIRTAGPSLVCGMEADAAVEEFVTIVPVGENSTVVQDPEFVTVLNVSVTKGGAEVIVNRPRGARLGLGLKFEGGSAATEKVRRLLVQSCAEDSPAANACTPWGKLISGDEILAIDGTPVSELTRIECVRRLKDSDESLILLVRHFETLDKVDQQNMETKETVMTDSKTFVDISRPLTLPPPVPPRKLGKKNSFKDKTTLQTVGEQNALMNLNLSDTGNDKDSIISALVHQHSMVSTMNKLSRKSSFDSHIHRQTKESFAHLKKGSPEEVRRLVRRLSDGKTIPPEAEVYIDLLSNEWERCLVLADAESDDTGSSISTVVDRLGSMASSVENSIPSTPVMQQKSIDIQKVLNSIENIDSDILKDMTNVKYSETKVDRNDDLKRCLRNSMTNGQKVSNTNSNIVTENIKPKQCENDNNNNETSKTLAPNDTFAINDKKMKEDVVLDKPKPMPRSTKVERSASEKKRRPVPIPEVQPPNISEPLLTPTKKTCIESWLQRSEAEMQNTSTEKIEETTIPEALPRLIDFVPKNQYKEKSNESPTCVRPTTAPPPPPVPPPETREDGSGASLDTIGELDETCDVVDNAKQTKDIETNKRKSHYERNFWDDRVNRSDAEDKSLSNDETPLPSCPRQPPDGVETPSDVVEKVPDLPTRLPPTTWISTRSRYSYASRTQDARSEASVKDKIAMFSVDLAASSDRLDKCGTLPARSHSTVRKNAPSFKNDYTEISSLDRRLTKSQDNLDETPRSYKRNLDRPEVLGALENSHIEKKGYRSKPSDMFGKPLFYGSTTTLPTNISPNKSIYHARSISDDNSNKNSASHKSNLEYLIEQRKKSMSKLRGLVIPEVQAPIVDLPEIKVKDPPPKTLLHNFSQIQTTKESKSGSKNPLFVSENKWNTSFLTNNIPKYSPAFKRKFLQVYTPSLSKETTPERKLPSKVDTNERIINNYNNSFSSKPARITQEYPKPTNKSTQLLNKEFYKINSNDKNNDFKNYEIRICTTTDVVDSDNDSAMSSTQSSYRSSASSPMHNMDHLESDSSRLSPKLSHYNSYSIVKTEIPNKLLPISQKNYEEYSKRKVCRSMSSDTNISLSSSAGSAATSGSQASCSSLESSVADSDKRKVSTIYNVDTINRRNIVASSKCRSGRDVTLTSPVIETKFSHESYNRSPSPTHKPSDRLSTLTSTVSAVANKGENRRRNKKIVSDSDSDNEENIRQRKPDYKNTRLKRNSSTTNKNNKYSDNVQVTEVIEKESVLKEKVSKGKDCNNEIQDNQKDLDKNKSEVINTTGLTKIEKDKEKRNGITPKKDVPVKLQNVKPVSIPVINSNNVQEKPVKVTTQVIRLIKGAGSGVGLILAGGIDCEAKDVTVHRVLEDSIAAKAGIKRGSKIQSINGNAMSGMTHAQSVKVLKEQRSEVIIEIELPDNRTLKDCGSQHSESKGQQGMDGTKFRNNSGRSIVTVILEKAGGGAGLGFGLDGGRDSPQGDKPLTIKKLFAGGAAAQSGKVLVGAELLSAGGQAMEGFTRTQAWAALKALPAGQVTLVLRNP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: