MonarchBase - Protein-coding gene

DPOGS213854
Transcript	DPOGS213854-TA	3252 bp
Protein	DPOGS213854-PA	1083 aa
Genomic position	DPSCF300361 - 81804-93045
RNAseq coverage	593x (Rank: top 21%)

Annotation
*Heliconius*	HMEL010304	0.0	82.15%
*Bombyx*	BGIBMGA009661-TA	0.0	72.30%
*Drosophila*	vlc-PD	3e-32	48.55%
EBI UniRef50	UniRef50_D6WRU7	2e-32	40.95%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WRU7_TRICA
NCBI RefSeq	XP_974796.2	3e-33	39.67%	PREDICTED: similar to vlc [Tribolium castaneum]
NCBI nr blastp	gi\|189238791	6e-32	39.67%	PREDICTED: similar to vlc [Tribolium castaneum]
NCBI nr blastx	gi\|195402625	2e-51	32.40%	vlc [Drosophila virilis]

Group
Gene Ontology	GO:0007267	1.1e-13	cell-cell signaling
KEGG pathway
InterPro domain	[835-992] IPR005026	1.1e-13	Guanylate-kinase-associated protein
Orthology group	MCL21932		Lepidoptera specific

Nucleotide sequence:

>DPOGS213854-TA
ATGTCTGAAAAAGTCATTGCATTCATTAGTGCACCACACTCATTCGATTTACCTGATGAAGAAGATAAGAAATCGCCCGTTCTTTTGTTAGGAGTGAACAAGTTATCGGATTCTCCATTTTTCCTGAGAAGAAGACTCACAGACCCTCACTCATCAGGATCAATTAGATTCTTCCGCCCGCCAAAATCAAAGTATACGAGGGGTCTAAATGGCGATGAGAGATTGGAAAAGATTAGACAAGATCTTCTGGTTCATAAGAACAAACCAGACACCTACATTCCAAAACCTGAGGTCTCAATAGAACCGGAAACTAAAGGGCCTTGTATTAAACTAGGCTGCGTCGGTAACTGCATCTGCGACAGGAAGAAATCTTCGTCCAACAGAGGCTCTTTTTCATTTCATAGGCCAGAAAACAGACAGCCTTCTCTATGTCCATCAGAACCCTATGGTAGAGCTGAAAGTAGAGACAACACAGAAAACGACATAGAGTTCAAATATACGGAACACATTCCAGATGTACAACCCTCAAGCAGCAAGCAAAACTCATACAACGTGACACCGAAGTCCACTGAACGAAGACACATACTACTTTCAAACTTGAATGAGAGATTCCGCAAAACCCTCAGCTTAGATTCAAGGAAGATCGAAACAAATCGAGTGCTGAGCCTGCCACAGGAACCTAGACCAAAATCTCTAGTTAATACAGATAACATTTGCGTGCAATACTCTTCGAAAGATCCCTTCATTCCGGCTAATTTAGTAAAAACCAGCCAGCCCAAGAAGAAACGCAAATCGTTCTTTTCTTTAGACACATTCTTTGATTCAAAAAGGTCAGACACGTCCTCCATAGATGACTATTGTTCCTCGAAATATAAGCGTTTTGAACTAGAAAGTGATGACTCTCCATTGTTCAGACGTGAAAGACCAAGAGAAAGGACCCCAGATCTTCTTAACCTACCTGTAATCATAGATTCCGTGCGAAAAAAGCAATCAGACACAAAGAGGCAATTGGAGAAATTAGAAAACCATTTTTATAAGAGCCTGGACAAACGCACAGTTATTGACGCCGTACCAGCCGATGCGACAGAGGGACCGAGCGGTATCAACCATCTGTACGACGAGGAAGTAGAGTATATAGAACCGATACGAAGCACCTTCACCAGCCAGAGCACCTTGATACTAGACAAAAACACAGACACGCTGAAACAAGACTCCATACTGACGATAAACACGGAGGAAATTGACATAAAACTACCAAGTTCAACAGTGTCGCCAGCCTCAAACAAAATAGAAAATGACATAGACAGTATCGGGGCTTACGAAATAGAAGTCAAGGAGTGCGATCTGAAGTGCACTAAGAACTTGGTTGTCAAAGTTATGGACAAATCTGTTGACTCGATTGGAAGTTGTTCCTTAGATGTCGATGCTAGTACGGACTTCTCAGATACTACATCCGGAAGCTTGAATCTCCTTACGCCTTCGTCGACGACCAGTAGGATACGGGATTTCACTTCCAGGATACAGGAACGAGCCTCCAACCTCCACACAATATCACCGCAGGCTCCAATATCACCAGCCAGGACACCAGACACAACCCCAACACCTCGGAAGACTGATCACCTCCTGAAACCTCCGCCGAAGATATACATTGACACAGCGAGTCACAGGTCGAGGAGTCACTTGAAGAAACGGGACGAACTACCGCAGAAGAAGCCAAGCTACCTGAACCTAGCGTGTTCAGTGAACGGGTACACGAACCTGACAACGTACGATTCCAAATTGCGTCAGGACATCAACAAGAGCCGAGAAGCTTCCCCAATAAGGCCCATAACACACACGTACCAGTATAAAAGTGAGAGCAGCTCACTGTTAGTGCCGATCCCAGTGAGCGCTAACAAACTGTTGGTACCGAAGTTCGGTCCTAATGATACTCGCACTGATTTGACGCCCAAAGCGCCTTCCAAGGCGCTCACCGACCCACACATAGCATCCCCATTACATGCCTATATGGCAGCAGAAAATAAACAGCTGAAGAACGACTTCTTAGGGCAAAGCATGACGACTACCAGTCGTCAGTTTATATCGAATGAGGGCAAGAACTTTGCTGCGTCTATGTTACACCAGAAGGATGAGGTGGATAACGTTAAGGAAATAACATTCAAGTCCAGTTACTCGGAGACGAACTTCAGACAGACGGTCAGCAATGGCAAAGAGAGCAGGTTCTCCTCTGAGTCGTATACGATATCTTCGAATGGTGTCTCCAAACGGGTCGAGATCACCAAAGAAAACGGCGAGAAGCTGACGAGTCCCATGAAGAGCTTCATACAACAGCGCGTCGAACGCCTGTACGGGCCGGGAGCGCTCGCTCAAGGATTCTTCAATCAGAAAAGGCACAAGCTGAAGAGTACAAGCGACGATGAAGACTCGAAGGTGTTGACGGAGAAGTCATTAAACTGCCCCAGCGAGAGATTCGTGTCACCGCGCAAAACGAACGAAAGCTTCGACAGTGAGAACATATGCACCAGTCCCACGAATGATACAACAGTGCTGCCTGTACTCAGGCATCTCAGGCCCGAATTTCGAGCTCAACTGCCAGTGCTCTCACCGCGGAAGAGCTTGAAGTCCGATCTCTCGCCTCAGAAGCTGGAACAAGACATTCCGGAAGCGAAAAAGACTGAATTGGTCGAAACCAGCGAAGTGACCAATGGCCTATCTGTGATAGATTTAAACAAACCAGTGAAAGAAAATTGTGAAAGTGAAAAAGTTAACGGTGATGTGGTTAAAGATGGACATTACTTCTTGGATTTGGAGAAGAAGGAAACTGAAAGGTTGATTGCTCTGGCCGTGGGCGCTGAAAAGGAGTTGGAGCACTTGCAGAATGTTGACAATGTAAGTGAAGAAGTGCTGGGCTTCCTCCGAGCTGCCTCTGGCAAGGCGAGGCTGTTGGCCACACAGAAGATGCAGCAGTTTGAAGGTGCACCCACAAATCTCCCCCTTGAGACAAGCTACACCCAACTCAGCGAAATAATAGACTTCTCTGAAGTCAGGCTCCGACTATCATTAGAGCGTGCAGCTCGTGAACGACAGCTGGCAGCTCGGGCTGGACCCTGTGCTGGAGAGAGCTCGCTCGGACAGAACGGAGAAGAGAATAAGGAGGTAGAAATATTTGTAGGCAAAAATTCAAAGTCGAAGCAGATACAACAAGGTGACTGTCTCGGTTCGTCATCAGAAAACTCATTTACTCAGAGCTGA

Protein sequence:

>DPOGS213854-PA
MSEKVIAFISAPHSFDLPDEEDKKSPVLLLGVNKLSDSPFFLRRRLTDPHSSGSIRFFRPPKSKYTRGLNGDERLEKIRQDLLVHKNKPDTYIPKPEVSIEPETKGPCIKLGCVGNCICDRKKSSSNRGSFSFHRPENRQPSLCPSEPYGRAESRDNTENDIEFKYTEHIPDVQPSSSKQNSYNVTPKSTERRHILLSNLNERFRKTLSLDSRKIETNRVLSLPQEPRPKSLVNTDNICVQYSSKDPFIPANLVKTSQPKKKRKSFFSLDTFFDSKRSDTSSIDDYCSSKYKRFELESDDSPLFRRERPRERTPDLLNLPVIIDSVRKKQSDTKRQLEKLENHFYKSLDKRTVIDAVPADATEGPSGINHLYDEEVEYIEPIRSTFTSQSTLILDKNTDTLKQDSILTINTEEIDIKLPSSTVSPASNKIENDIDSIGAYEIEVKECDLKCTKNLVVKVMDKSVDSIGSCSLDVDASTDFSDTTSGSLNLLTPSSTTSRIRDFTSRIQERASNLHTISPQAPISPARTPDTTPTPRKTDHLLKPPPKIYIDTASHRSRSHLKKRDELPQKKPSYLNLACSVNGYTNLTTYDSKLRQDINKSREASPIRPITHTYQYKSESSSLLVPIPVSANKLLVPKFGPNDTRTDLTPKAPSKALTDPHIASPLHAYMAAENKQLKNDFLGQSMTTTSRQFISNEGKNFAASMLHQKDEVDNVKEITFKSSYSETNFRQTVSNGKESRFSSESYTISSNGVSKRVEITKENGEKLTSPMKSFIQQRVERLYGPGALAQGFFNQKRHKLKSTSDDEDSKVLTEKSLNCPSERFVSPRKTNESFDSENICTSPTNDTTVLPVLRHLRPEFRAQLPVLSPRKSLKSDLSPQKLEQDIPEAKKTELVETSEVTNGLSVIDLNKPVKENCESEKVNGDVVKDGHYFLDLEKKETERLIALAVGAEKELEHLQNVDNVSEEVLGFLRAASGKARLLATQKMQQFEGAPTNLPLETSYTQLSEIIDFSEVRLRLSLERAARERQLAARAGPCAGESSLGQNGEENKEVEIFVGKNSKSKQIQQGDCLGSSSENSFTQS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: