MonarchBase - Protein-coding gene

DPOGS214241
Transcript	DPOGS214241-TA	1461 bp
Protein	DPOGS214241-PA	486 aa
Genomic position	DPSCF300014 + 1170244-1175047
RNAseq coverage	549x (Rank: top 23%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA005962-TA	2e-112	85.11%
*Drosophila*	mbl-PH	2e-76	74.18%
EBI UniRef50	UniRef50_D6WKH9	8e-99	69.85%	Putative uncharacterized protein n=3 Tax=Endopterygota RepID=D6WKH9_TRICA
NCBI RefSeq	XP_001812946.1	4e-98	65.08%	PREDICTED: similar to muscleblind CG33197-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270007552	3e-98	69.85%	hypothetical protein TcasGA2_TC014149 [Tribolium castaneum]
NCBI nr blastx	gi\|270007552	9e-100	70.11%	hypothetical protein TcasGA2_TC014149 [Tribolium castaneum]

Group
Gene Ontology	GO:0008270	1.1e-05	zinc ion binding
	GO:0003676	1.1e-05	nucleic acid binding
KEGG pathway
Orthology group	MCL15809		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214241-TA
ATGTGGTTGGGTTTAAACGAATTCTTATACTTCGCCATCATAATTGTCCAAACAATATTTTTGCTTCCAGAAAATGGACGGTGTAACCGAGAGAAACCACCCTGCAAGTACTTCCACCCCCCGCAGCATCTTAAGGATCAGCTGTTGATTAACGGTCGGAATCATCTAGCATTAAAGAACGCCCTGATGCAGCAGATGGGCCTTACGCCGGGCCAGGTGCTTCCTGGCCAGGTCCCAGCAGTTGCAACATCACCTTACTTATCGGGTGTGCCCGGAGTGGGCTCGACGTATGCTCAATACTATGCGCCGCAGCTGGTTCCGGCTGTGTTGGGTCACGACCCGTCCGCCGCAGCCGCCTCGCCACTAGGAGTCATGCAGCAGCCCGTATTGCAGCAGAAACTGCCGCGTACTGACCGTCTTGAGGTGTGCCGGGAGTTCCTGCGCGGCGCGTGCAAGCGGGCCGAGTCCGAGTGTCGCTTCGCGCACCCGCCGCCACCGGTGGTCGCTCACGACGACGGCTGTGTCACGGTGTGCATGGACGCCGTCAAGGGCCGCTGCGTCCGCGACCCCTGCCGCTATTTCCACCCTCCCCTGCACCTGCAGGCGCACCTTAAGGCGCAGGCGCGCGGCGCGATGGACATGAAAAGCGTCGGTTCCTTCTATTACGATAACTTCGCCTTTCCCGGTGTGGTCCCGTACAAAAGACAAGCTGCTGACAAAGCCGGAGTTCCCGTATACCAGCCGGCGACTACTTACCAGCAACTGATGCAGCTGCAGCAGCCATTCGTGCCCGTGTCATGTGAGTACCCCGCGCCCGCCTCGTCCGCCCCGCCGGCCGCGGTGACTGCGGTGTCGGGCGCCGCAGGACCCCAGACGGCGCCCGCGGCCGTCCGCCGCGCAGCCCGCTCCTCCCGCGCCCGCCTCGCCACCCGTCTCCGTTGCCGACGCGGCTGTACCGGACCCCGCCGCCGTCGCCAAAGAGGTCGCTCACAAGAATTACGCGGCCGCGCTCGCGCTCGCCGCACAGCACTCCGCCATGGCACACGCGGCCGCCGCCTACACACAACAGGCGTTCAAGGCCCGTGCCGCCATGCCGGGGTTGATGCGCGCACCGCTCATGATGCGGCCGGGTTGGCCCGCGCCGCCCGTGCCCATGCCCGCCTTCTATCAGCAGCCTTACATGTACGCGATGCCCCCGCCCGCGGCACCGTCCGCAGCCGCGGCGGGGGCGGCGGCGGCCGCTGCAGTCAACCCCTACAAAAAGATGAAGACGACCTAAGACGCGCGGGCGGGCCGCGGCCGGAGGGGCGCGGGGTGCGGGGTCTCCGCGTAGAGACTCGTACGTGTGCGATAGTGTGGCCCTGGCCTGTCGGGGCGTTAGCGCTAGGCGTGTTGTCACATTTGTATTGTATTATTGTAAGGACGAAGCGAGCGATTCCCGTCTCGCGGAAGTCTAGGTAG

Protein sequence:

>DPOGS214241-PA
MWLGLNEFLYFAIIIVQTIFLLPENGRCNREKPPCKYFHPPQHLKDQLLINGRNHLALKNALMQQMGLTPGQVLPGQVPAVATSPYLSGVPGVGSTYAQYYAPQLVPAVLGHDPSAAAASPLGVMQQPVLQQKLPRTDRLEVCREFLRGACKRAESECRFAHPPPPVVAHDDGCVTVCMDAVKGRCVRDPCRYFHPPLHLQAHLKAQARGAMDMKSVGSFYYDNFAFPGVVPYKRQAADKAGVPVYQPATTYQQLMQLQQPFVPVSCEYPAPASSAPPAAVTAVSGAAGPQTAPAAVRRAARSSRARLATRLRCRRGCTGPRRRRQRGRSQELRGRARARRTALRHGTRGRRLHTTGVQGPCRHAGVDARTAHDAAGLARAARAHARLLSAALHVRDAPARGTVRSRGGGGGGRCSQPLQKDEDDLRRAGGPRPEGRGVRGLRVETRTCAIVWPWPVGALALGVLSHLYCIIVRTKRAIPVSRKSR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: