MonarchBase - Protein-coding gene

DPOGS213354
Transcript	DPOGS213354-TA	1077 bp
Protein	DPOGS213354-PA	358 aa
Genomic position	DPSCF300109 - 191751-196358
RNAseq coverage	74x (Rank: top 66%)

Annotation
*Heliconius*	HMEL016386	5e-48	35.40%
*Bombyx*	BGIBMGA009120-TA	1e-77	43.02%
*Drosophila*	cora-PA	1e-74	42.01%
EBI UniRef50	UniRef50_F4WT51	2e-74	41.74%	Protein 4.1-like protein n=5 Tax=Apocrita RepID=F4WT51_ACREC
NCBI RefSeq	XP_973434.1	1e-77	43.75%	PREDICTED: similar to coracle [Tribolium castaneum]
NCBI nr blastp	gi\|270009420	1e-76	43.75%	hypothetical protein TcasGA2_TC008668 [Tribolium castaneum]
NCBI nr blastx	gi\|270009420	2e-72	43.75%	hypothetical protein TcasGA2_TC008668 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.7e-25	protein binding
	GO:0005488	5.7e-25	binding
KEGG pathway	tca:662229	4e-77
	K06107 (EPB41, 4.1R)	maps->	Tight junction
InterPro domain	[13-231] IPR019749	2.3e-42	Band 4.1 domain
	[226-319] IPR011993	1.7e-25	Pleckstrin homology-type
	[110-223] IPR014352	5.7e-25	FERM/acyl-CoA-binding protein, 3-helical bundle
	[114-226] IPR019748	1.7e-24	FERM central domain
	[235-324] IPR018980	4.4e-17	FERM, C-terminal PH-like domain
	[50-62] IPR019750	5.4e-16	Band 4.1 family
	[21-113] IPR018979	2.1e-12	FERM, N-terminal
Orthology group

Nucleotide sequence:

>DPOGS213354-TA
ATGCGGGAGAGTCTTCGCCGCCTCGCATCAGACGACATCCCTCCCAGAGGCAGGGTCCGCGTGGAACTGCTCACGGGAGAACACATCACTATTGATCTTGATAGGAAGGCCCTCGGCGGAGATTTACTGGACCTGGTCTGCGAGTCCTTAGACGTGATCGAGAAGGACTACTTCGGGCTGCTTCACGCACAAGGGGAGCCCAGAGTGTGGGTACACCTCGGCAGACGACTCAGCAAAACTTTCAAAATCCTAGCAGCAGTTCCACAGTTTCCGCTACACTATAGACCTCATATTTCAGACGAGCCCTGGGATGTACGGTTTGCTGTGAAGTTCTATCCGCTGGAGCCGTCAGCTCTCAGAGACGACATGACCCGCTACCAGCTGTCACTGGCGCTCAGGCGAGACCTCATGGAAGGACGTCTGACGTGCTCGACGATCACATACGCACTGCTCGCGTCCTACGTCCTCCAGGCAGAGGCGGGGGACAGGTCCGCGGCTGTCCCGCTGGGGGCGGGGGCCACGGCGGCGCTGGTGACCTCGCACAGAGCCGTGCCGCTTCACGTCCTCAACGAGGACATGGAGATGAGAGTCGATGAGTTGTATAGGAAACACAAAGGTCAGACGCCGGCGGAGGCCGAACTGAACTATCTGGAGAACGCCAAGAAGCTCGCGTTGTACGGAGCCGAGATGCATTCGGTGAAGGACTCTGATGATGTAGAGCTCTCACTCGCCGTCTGCGGGAGAGGAATCGCCGTGGTCAGGGACGGGACGGTCATGAATCGCTTCCCGTGGACGAAGATATTGAAGCTCAGTTACAACAAGCGTCTGTTCGTGATCCGCCTCCGAGCCGCGGACTCCGACGAGTGCGAGACGGATGTCAGCTTCCGACTCAACTCCTCGCGGGCCAGCGAGCGCCTGTGGACCAGCACCGTGGAACATCACGTGTTCTTCAGGCGCGAGAGTCCGGTGAAGGTGGAGCGAGTGTCAGGGTTCCCGATGCTCGGGGCCCGGCGACTGTCTTGTCGGCGGACGTTGCGACAGATGCGCGACACGACTGTCGCAAGACAAGTTATTTGA

Protein sequence:

>DPOGS213354-PA
MRESLRRLASDDIPPRGRVRVELLTGEHITIDLDRKALGGDLLDLVCESLDVIEKDYFGLLHAQGEPRVWVHLGRRLSKTFKILAAVPQFPLHYRPHISDEPWDVRFAVKFYPLEPSALRDDMTRYQLSLALRRDLMEGRLTCSTITYALLASYVLQAEAGDRSAAVPLGAGATAALVTSHRAVPLHVLNEDMEMRVDELYRKHKGQTPAEAELNYLENAKKLALYGAEMHSVKDSDDVELSLAVCGRGIAVVRDGTVMNRFPWTKILKLSYNKRLFVIRLRAADSDECETDVSFRLNSSRASERLWTSTVEHHVFFRRESPVKVERVSGFPMLGARRLSCRRTLRQMRDTTVARQVI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: