MonarchBase - Protein-coding gene

DPOGS213722
Transcript	DPOGS213722-TA	4332 bp
Protein	DPOGS213722-PA	1443 aa
Genomic position	DPSCF300310 + 29146-37668
RNAseq coverage	389x (Rank: top 31%)

Annotation
*Heliconius*	HMEL004450	0.0	74.95%
*Bombyx*	BGIBMGA011628-TA	0.0	73.01%
*Drosophila*	CG42669-PK	2e-20	40.17%
EBI UniRef50	UniRef50_D6WHG2	4e-52	42.31%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WHG2_TRICA
NCBI RefSeq	XP_975321.1	7e-53	42.07%	PREDICTED: similar to CG33232 CG33232-PC [Tribolium castaneum]
NCBI nr blastp	gi\|270004214	1e-51	42.31%	hypothetical protein TcasGA2_TC003538 [Tribolium castaneum]
NCBI nr blastx	gi\|270004214	2e-59	35.15%	hypothetical protein TcasGA2_TC003538 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL25874		Lepidoptera specific

Nucleotide sequence:

>DPOGS213722-TA
ATGACCATTCAAATATCACGTACTATTACGAAGACAAGAAACCGTCGATCCCTTGAATCATCTCTTCCTAAAGTCGAAACTCCGTTGCAGTCTTCCAAGGTGTCTCCCAAAGTTAATGCTTCCATACAATTTGGCTTTAAATCAAATCTGACTAAACCTAATCCAGTCAAAAGTACTGAAAAACGAAGAAGTTCTGAAAGTAGCGCTAAACCCAGTTGTATACCGTTATCCAAAAAGACCCCTGACAAAGTAAAACGTAATTCAAACTCACCTTCTAAATCGGAATCTCCAAAAGATACATCAAAAAGTGATAGTACAAGAATTAAACTGGAATCCTCTAGGGGAAGAAGTGTACGCAAAAGCCCTGATAAATCGAAGATAGCTCTTCCTCAAGAAAATTTTCGTAGCGATAAGAAACATCGAGCTCAAAAAGATAATGAAAGTCTTAACGAAAAATATCATAATTTTAAGAAAAGACTGACTAGTTTAGATAATTCTTCAAATGACGGTGCTGATACTAAGAATACAACTAGCAAAATTATTGTAAATGAACATTTGGTAACAAATCCTGACGTGGACCATAATTCGACGACAACAAATATGACTACCCTCCATGAACCAATAAGACCGCATGCAAGCTCTCGACTTTCTCAAGAAATGGATAGCTTAGCTGCTTTGACCAAACAAACATTAGATAGAGTAAACAAATTAACAAATAACTTAAGTAATAGTAAATTACCTGTTTTAGATAGTACGGAAGAAAATAAATACAATCATACTTACAACTACGGTCTCATTAACGATGAACCCCAGACAAATAGGGGAGTGGCAGAGAGATTAAGAGATATAGATACGGCAGCTCAGAGATTGATTGATTTCGAAAAACAAAGTGCTGTGTTTTCTGATCTCAACAACGATTGCTCTAGTCAAAACCGTCGTCTTGATAACTCCTCGTTGTCTCAACACACGCCAGTGTCTATTTTGAAAAGAAAATCTATCCATGAGGAATGTAATATCACCAATCCCTCAAGCCAAGCCATTGCTTCTCCGCCTGTTACCTTCTCTCCAAGTGTTGTTGAACCACGAAATTGTCGTTCGGAGAATAGGCAGCGTCAAGGAATACTAAAGAAACGACGTAGCTTAGATGAATCTCAAGTTGCTAGACGTAGGTCCTGTAGTCCAGAAGTATCATTTGCTGATGACGGATCACCTGATACGTGCAAACCAATTTTAAAAAATCGGAGATCATCCTTGGAAGACGTAGTTCGAAATCGTTCTCCAGACGGACAAATACAAGGGATATTAAAAAGGAAAATGAGCAAGGAAGAGGAACATTTAGCTGATGATGTATCACATGGTTCACCTGAGCCTCATGGTATTTTAAAACGGAAATCTAATTCAAGTTCAAGTAGTAGTACAACCTCATCTCACGTGTCCATTGCCCAAGCGGTGTTATTGGCGGCTGCCGGTGGTGCTGAATTGGTTGATGAGGATAAAGATACGGTACGACCCATACTTAAAAAGAAAAGTTTCTCTGAAGAACGCCCCTCCCCGGATATACTTACTTCAGACACCCCAAAACCTATTTTGAAAAAAAAATTGACTGAGCACGATGATCATGACTTCGAACGTCCGAAGAAACCAATTCTAAAGTCGTCAAAAAAGATATCTGGTGATGACGGACATACTTCTAGTTTCGATTTGAGCGAAGACGACAGAAGTTCCCGTAGGCCTTCACTACTTAGGTCTCGGACGTCTGATCACTCGGGTTCAGAATGCGAAACGGCTGTTAAGCCAATTTTAAAGCAGAGATGCTCTAGTCTCACTAGGGAACGCAGCCAATCTCCCCGCCCACGTTTGTCATTCTGTGCAGACAACGATGTGAATATTAGTGCTTCAAATTTTAGTAGCGATGTGAACGACTTGTTAGCGGCTGGACCGCGGCGAATTGTGAATATCGGTACTGATCCTGAAGAAAATTACCCTAGTGCAGTAATACGGCGAAGAAATCAGAGACCTAAAACGAATATTCGTTCTATCAGCTTGGTGTGTGACGTCAATGATGAATTACTTTCTATTTTAAATAATCGTCGCCTGAAAGTGGAAGAGCAGTGTAACAACGGACAAAATAATATATTAGGAAGGGAGAAATTAAATGAAGGCAACGATCCTAAAACTTTTCCGTCGATCGCTTCGAGAATAAAGACGATGGAAGAGGCACTTACTAAGGATAATATACCGCAAGAACAAGCTTCAATGAAACAAAGAAATCGAGACAAGGAGCGTTTCAAAACGCAACCTATCACAATCGATGAAATGAGATCTGTCGCATCCAGTTTGGAGCCGGGCCAAGCGAATTTCCAAGCGTTCGGCATTGCGGGCTGTAGTTTTCCGACCCATTCCGTCGGGACTGGTGCGTCTCTCTCATCCAGGGGTCTCCTTTCAGAGGAGCCCGAAAGAGATCCTTACACAGAATTTGAATCAACTTCTTACGATTCTAGTCTGTCGAACGCTAAGTTACCAGTCACAGAGGACTACGGTGAAGCAACTTTCTTAGATTTGGAGAAGTTTAGTGCTAATGGTGAAATAAAACAGTCTACTCTAGATGAAATAGAGCAAGAAGTAAACAAAGTGCGTGTAGCTCTGGATGAGGATTGTCGCGCCTTGGACGAGGACGATAGTAACCAAGCCGAGGCTGACAATTGGAGTTTAAACGTTTCTTGTGATAGCGGCGTTTACAATCGCGCGTCTTCCCGCGACTCCGGGCCGCATTCTGGCGAGGAGTTGGGCTTAATTGAGAGCCAAGAAATTAGTGAAAACCACGCCACCAACAGCACCAACGACTGGTCTTCGACATCTATGGAAGAAGGTCTATTCAAAATGGAACGCATACGAAAATCAACTGAAAACGAAGCGCTTCAAACTCCTGAAGATAATGGGAGTGATGACGAAAACAATGATCATTCTCATTTCGCACTCGGCTTAGTGAAAAGCAACAGTGTCGTTGCTCGAGCAAGCATGTGGCAACAGTTACAACAGCAAGCTAAAGGTACGCCAAAGCCGCTTCTTCGTCACAGTCGCTCCAAAGTGAAGGAGGGTCCTTCGATGACGGAGAGCTTTAAAGCCCAGGAAATTAACACCGTTCCGCAAGAAACCCCACTTGCCCCATCTAAAAGCACAGCAAATGTCTTAGATAGAGATGAAGATGCTAAGTTAGATGAGGATGATCCGGCGAAGATGTCGCTGGCTGACAAAATGAAAATGTTCAACACCAAATTGACACACAAGCCGCCGGTAGCCGGTCTGAGGCCGAAGGAAGATAGAGTGCCGAGAGCGTCTAGACTCAGAACCATGCCGGTACTAGCGAGTCAGGTCCAAGAAGCTATGGAACAAAACGAGAGACTAACAAAGTCTCTAACCCACGAGGATGTCCCGAGGAATAATGACTTCCAACTGAAGATGGAACTTTTCCGATCGGCGAGTGCAAAAAACACGTCATTAGAGTATCTCATGAGGCAGAACTCGAAGTTTAGAAGCTTAGACCTCGATGACGACTCGCCATTGGAGCGAGCTCAAAGAATGATAACACCGGAAGTGAGAGGTATACTGAAGTCGGGATCTACGGTTGTACCTTCGAAGCCGAAAATTTTGGCGAAAGGAGAAAGTTCTGAGGGTCTCAAGGACGAGGGAATAGACAGTTCCTCGGACGAAGAATCCGCATCAGCATCCAGTGTTTCATCTTCAGAGAAAAGCTGCTCATCATCAGGTAGTTCAGATGAGATGCCAGGACCGAAGAGGAGGTTTCAGCGAAAGAACAACAAGCTGAAGTCGTCGCGAACTGACTCAGATCTCACGAAACTCCAAGATCCATATCCTCGTAAGATCCAACTGCCGTGCGCCAGTGAATTAAAAGAACGTATAGCGCAAGCGAAAAACCCTGATGTCAAAATACCATTGCTGGGGAAACTCGGCAAGAAACCATCAGAAGAAGCCAGCGGAGAGGATGACAAGCTGAGATACAAAAGATTCGTCAAGAAACTCGACGAGCCTCTGCAACTGGGGAAGTTGAGGCGGCCGATGGAGAAAACGTCGTCGCTGGAAGAAAAACCGCCCGTGCTGAAGATAACGGCATTAAATCAAGCTGCCAAAAACAAATTCTTTGGTGTCGAAGACAAGAAAGAGAAGAGCACCGATGAATTGACGGCTGTGGTCAGAAAATATATTCCGGTAAATTCAGTGTCACGTCACAGTATAGAGGGCGGTTCGGGTAGTGACGGGGAGAGCAGCGGCGGGCGGGAGGTGCGACACATCAACACTAGAAGGCAGAGGTAA

Protein sequence:

>DPOGS213722-PA
MTIQISRTITKTRNRRSLESSLPKVETPLQSSKVSPKVNASIQFGFKSNLTKPNPVKSTEKRRSSESSAKPSCIPLSKKTPDKVKRNSNSPSKSESPKDTSKSDSTRIKLESSRGRSVRKSPDKSKIALPQENFRSDKKHRAQKDNESLNEKYHNFKKRLTSLDNSSNDGADTKNTTSKIIVNEHLVTNPDVDHNSTTTNMTTLHEPIRPHASSRLSQEMDSLAALTKQTLDRVNKLTNNLSNSKLPVLDSTEENKYNHTYNYGLINDEPQTNRGVAERLRDIDTAAQRLIDFEKQSAVFSDLNNDCSSQNRRLDNSSLSQHTPVSILKRKSIHEECNITNPSSQAIASPPVTFSPSVVEPRNCRSENRQRQGILKKRRSLDESQVARRRSCSPEVSFADDGSPDTCKPILKNRRSSLEDVVRNRSPDGQIQGILKRKMSKEEEHLADDVSHGSPEPHGILKRKSNSSSSSSTTSSHVSIAQAVLLAAAGGAELVDEDKDTVRPILKKKSFSEERPSPDILTSDTPKPILKKKLTEHDDHDFERPKKPILKSSKKISGDDGHTSSFDLSEDDRSSRRPSLLRSRTSDHSGSECETAVKPILKQRCSSLTRERSQSPRPRLSFCADNDVNISASNFSSDVNDLLAAGPRRIVNIGTDPEENYPSAVIRRRNQRPKTNIRSISLVCDVNDELLSILNNRRLKVEEQCNNGQNNILGREKLNEGNDPKTFPSIASRIKTMEEALTKDNIPQEQASMKQRNRDKERFKTQPITIDEMRSVASSLEPGQANFQAFGIAGCSFPTHSVGTGASLSSRGLLSEEPERDPYTEFESTSYDSSLSNAKLPVTEDYGEATFLDLEKFSANGEIKQSTLDEIEQEVNKVRVALDEDCRALDEDDSNQAEADNWSLNVSCDSGVYNRASSRDSGPHSGEELGLIESQEISENHATNSTNDWSSTSMEEGLFKMERIRKSTENEALQTPEDNGSDDENNDHSHFALGLVKSNSVVARASMWQQLQQQAKGTPKPLLRHSRSKVKEGPSMTESFKAQEINTVPQETPLAPSKSTANVLDRDEDAKLDEDDPAKMSLADKMKMFNTKLTHKPPVAGLRPKEDRVPRASRLRTMPVLASQVQEAMEQNERLTKSLTHEDVPRNNDFQLKMELFRSASAKNTSLEYLMRQNSKFRSLDLDDDSPLERAQRMITPEVRGILKSGSTVVPSKPKILAKGESSEGLKDEGIDSSSDEESASASSVSSSEKSCSSSGSSDEMPGPKRRFQRKNNKLKSSRTDSDLTKLQDPYPRKIQLPCASELKERIAQAKNPDVKIPLLGKLGKKPSEEASGEDDKLRYKRFVKKLDEPLQLGKLRRPMEKTSSLEEKPPVLKITALNQAAKNKFFGVEDKKEKSTDELTAVVRKYIPVNSVSRHSIEGGSGSDGESSGGREVRHINTRRQR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: