MonarchBase - Protein-coding gene

DPOGS213788
Transcript	DPOGS213788-TA	3789 bp
Protein	DPOGS213788-PA	1262 aa
Genomic position	DPSCF300212 + 699670-710446
RNAseq coverage	532x (Rank: top 24%)

Annotation
*Heliconius*	HMEL016098	0.0	68.90%
*Bombyx*	BGIBMGA009269-TA	0.0	75.74%
*Drosophila*	kibra-PA	2e-133	36.77%
EBI UniRef50	UniRef50_UPI00020639E9	0.0	48.41%	UPI00020639E9 related cluster n=1 Tax=unknown RepID=UPI00020639E9
NCBI RefSeq	XP_396884.3	0.0	47.74%	PREDICTED: similar to WW, C2 and coiled-coil domain containing 1 [Apis mellifera]
NCBI nr blastp	gi\|383863280	0.0	47.42%	PREDICTED: protein kibra-like isoform 1 [Megachile rotundata]
NCBI nr blastx	gi\|383863280	0.0	49.34%	PREDICTED: protein kibra-like isoform 1 [Megachile rotundata]

Group
KEGG pathway
Orthology group	MCL10985		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213788-TA
ATGTTCCCTCTACCTGAACTCTCAGCCACCAGATGTGCCACATCTCGGATCAGACATTCCGTACTGAAGTCATATGGTCGCGATGGAGCCGGGAGCGGGCCCTTCGGAGAGATCGACCTCCGAAATGCGCCCGAGATTGCATTCTTTCGGCTGCGCGGGCGCATTCCACTGAACGGCCAGAGCACCGCGCGCCCGCGCCAGTCGACGCGCGCCCTTTTGGGGGTTAAGATGTGTCCGTCGCGGCGGGCGATCGCTATGTGGTCCAAACAACCGCCTCCCGAACTAGAGACTTTCCGCGCCCGAACAGCTTCCTTGACACACACGTGTTACAGGGGATCCTATGGTTCAGGTCATATAGCAAGGATGGTCCGCGAACCTCCCGAGTATGGAGTCCGTGTAGATCCAACCTCCATTCGTCCTCCCGGCCTTCGCGTTCGCGATGAGCCGCAGTATCAAAATTTGGACGAACTCCGCAAGAATCCGGAATACGCTAATCTGGATGAGATCAGTCGCGAATACGGTTATCGGCTCTGTCCCGAAGGTCAGAATCTTGAGGACGAGGCTATATACGAGAACATATTATCCGTGCGTCAGATAAGTTCCGCGGAAGTGCGTCTAGTGCCTGTGTCTGAAGTGCCGTACTACGAGGATCAAGGTTACGTGGCTACCCAAGTATTGAGCAGAAACGGCACCTTCCCTCAATGTCCTCCGCATACCTGGAGCCGTCTCCAGCAAGCCGGCAGGATGACTGGCTCCTTGAGGCTCTTCACTGCGAAGCGGGAAATGTACGATGTCAAAAAACAGAGACTATGTCTGGCTCAAGATGAGTACAAGCACCTCAACAACGCGCTGTCCACACTCGGAGCGTCCAGGACTAGCTTGTGTTCGTCAACTACATCAGTGACAACAACGTCGACGACTTCTCGTCATGACCCCGACCAGCTTCGTGTTGAGGTCACTCAAGCCAGGGGTCGGCTGGCTCAGCTCAGGAAAGAGTTGAGACAAGCAAGGGCGGAAGTAGCCAGCGCGAGACGCGGTTTTGACACGTTGGCTGAGGTAGAGCAAAAACTTAGCGCTCAACAAGGTTGTTACAATATAACAGAAGCTCAAGCTATTATGACTGAACTGAAGAATATACAGAAATCTCTCACTTCCGGTGAGAAGGAGAGAGCAGATCTTATGCAATCTTTAGCCAAGCTAAAGGATGACTTAACGAGGCTGCAATTAGGTGACGCTTCCCCGGAACTGTCCACTTTAAGTTTACCGCAGGAGAAGTTAAGCACTGCTTCCCAAACGGATCTTTGTGCGGATTTAGTACCAATAGGCACTAGACTAGCTGAAATGGCGCGGGTTCGCCTACAATACGACGAGGCTAGGAAGAGAATTCAACAGATCCAGCAACAGCTGGCTGATCTGGAGGACAAAGTCCAACCAGGTCAGGCGGAGTCTGATAAAGATAGGCTCTTACTGTTCCAAGAGAAGGAGCAATTACTGAGAGAATTGAGGAGTATCACACCAAGGACGAGGTCGAAACAGGAAATGAGCGACATCCAAACTGAATGTAAGAAATTGGAGCAAGATCTGAAGAATGCTTTCGAAATGTCCAACAAGTGTATAGCGGATAGGTTAAGGCTGCACGAAGAGAAACAGCTATTGTTGCAGCAGTTAAAGGACGCTTTAACTTCTATGACTGCGTTGGAAGGACAATTGAAGACTTTATCAGCTTCAACGTTGTCAGTGTCTAGCAGTTCCAGCTTGGGATCGCTGTCCACAGCGAGCAGTAAAGGCTCACTAAGTTCCGGGATAAGCTTCACGGATATTTACGGTGGACCACAAATAGCTACGTCCTTCCAAGCAGACAAACCAATTGATATGGTGGATCTTCATAGGCGAGTTGAAAGGTTACTCCGGGGTTCGTATGCTGAGCCTCTCACCAGCTCGCCGTCACAGCCGTCTTTATCACCACGGAGTAGTCTCTCCTCAGCGTCACCACCACCTCCACCATCCTATCATCAGGTGGAAAGACAAAGGCGACAGCAGAAGGAGTTGGAGGACAAACTGGCTGAGATGAGAATCGGCGTCGCTACCAGCCTCAGTGAAGTCACGGGACTTTCAACAATTCCAGTACAGCTACAGGGTCCGGGTCGGCCGGCGGAGCCTCTCTCTCCAATATCGGAGACGCCACCAACCGCTTCCTCTAGTGGCACGAACACTAGATCGGTATCAGCGGCTGTCAGTGATGAATCCGTTGCTGGTGACTCAGGGGTGTTTGAGGCGGCGCAGGCCGGGGAAGCCGGGTGCGTGAACAGTGCTCAAATTGAGATCAAATTGCGTTACTGTTCGGACGAGAGCGCATTAGAAATAGGCATCCTGCGGGCGAGGAACCTCCACGCGCTGTACATAGACGTGGGAACCGAAGTGTGTATCCGCGGAGCTCTGGTGGTAGGTGGTGGGGGTTCCGTGTCGTTCACGAGTCGCCCTCTGGTGTGGGCGGGGTCAACGCTGCTCTTCCGCTGGCAGCAGCGAGCAGCGCTGCAGCAGAGAGCACTGCAGGGGGGCACGCTACAGGTCAACGTCGCTGCCGGCGCTGAATGCCTGGGCTGTACACAAGTCAGTCTGGCTGACTTCGACCCTGACACTGTGTCACAGAAGTGGTACAACGTGCTCAGCTTCCGAAGCATAAGGAGAGATGAGAGCTCAGACGAATCCACTGTCATATCGTCTCAGACCTCCACACTAACTAGGAACAGAGGTCCGGAGAGTATGGCCGCAGCTGAATGTAACGCTGATTGCTGTGATAACTCAGCATCCGAAGACGAGGAATCCAGGGAACCGCTCAATCAGATAGTTGAGGAGGACTCCTTTGAGGACTACATTCCTGAAGAGGACATACATTTGGAGGACGAGTACCTCCCGTCCACAGCGGAAAAGGAAACCAACACCGAATGCAACTTCTGTCCGGAGGGAGCGAGACAGTTGCACAGACGAAAAAGTCAACAAGTAAGCTCAAACACAGAAGAGTCGCTGGCGACTATTAAACGATCTCAGACGTTCTCACCGCAACAGGGTGTTGGGAAGGGACAGTATTTATGCAGGCTCAATCGTTCCGAATCTGATTCGTCGATGTCCGCGCACCGCCGGTTGACGCTGCGGCCGCCTTCCCTCGGGATACCTTTCGATAGGAGCGTCAGGGAAAGAAGATCTTTAAGATGGTCCAAATCCGCTGGCCGTCCTTCTCGTCGCTCGGGTCGCACCTCGCTAGACCTCAGCCTGGACCTCCGAGCGCAGCACGAGAGACTCACGGATCTTAGAAACGAGATCGCTCATCTCACAACGCTCAAGAAGAGGATTGACTTTAAAAGCAATGACCCCGCTGTAGCTTCGTGGGTCACCGAGGACGAAACACTACAGAAGCTGTTATCAGCGCCGGCTGATAAGGATCGAGTGGCGAGACTCTTCACGAGGACCTGCAAGGAGGTGTTCAGATTGAGGAAGTCGAGGCAGGGCGGGCGGAAACCGGATCTGGTGACGTTCAAAGAAAAAATGGCGTTCTTCACTCGCAGCAAGTCGATCACGATAGCCGACGACGAGGAGCTGTCCGACGATTGGGAGGAACTGGAAAGACGGACTCCCGACGGGAGGTCTTCCAAGGTGTCGTACGAGAGAGGCCTGGTCGTGGAGTGCAAGAACCCCTGCATCCCCGACAAGATGGACGGCATCAGTATAGACGGCAACAACGACGACGTCTACGAGTACGTCGTGGACAGGGCGCTCGGGGTCCAAGTCTGA

Protein sequence:

>DPOGS213788-PA
MFPLPELSATRCATSRIRHSVLKSYGRDGAGSGPFGEIDLRNAPEIAFFRLRGRIPLNGQSTARPRQSTRALLGVKMCPSRRAIAMWSKQPPPELETFRARTASLTHTCYRGSYGSGHIARMVREPPEYGVRVDPTSIRPPGLRVRDEPQYQNLDELRKNPEYANLDEISREYGYRLCPEGQNLEDEAIYENILSVRQISSAEVRLVPVSEVPYYEDQGYVATQVLSRNGTFPQCPPHTWSRLQQAGRMTGSLRLFTAKREMYDVKKQRLCLAQDEYKHLNNALSTLGASRTSLCSSTTSVTTTSTTSRHDPDQLRVEVTQARGRLAQLRKELRQARAEVASARRGFDTLAEVEQKLSAQQGCYNITEAQAIMTELKNIQKSLTSGEKERADLMQSLAKLKDDLTRLQLGDASPELSTLSLPQEKLSTASQTDLCADLVPIGTRLAEMARVRLQYDEARKRIQQIQQQLADLEDKVQPGQAESDKDRLLLFQEKEQLLRELRSITPRTRSKQEMSDIQTECKKLEQDLKNAFEMSNKCIADRLRLHEEKQLLLQQLKDALTSMTALEGQLKTLSASTLSVSSSSSLGSLSTASSKGSLSSGISFTDIYGGPQIATSFQADKPIDMVDLHRRVERLLRGSYAEPLTSSPSQPSLSPRSSLSSASPPPPPSYHQVERQRRQQKELEDKLAEMRIGVATSLSEVTGLSTIPVQLQGPGRPAEPLSPISETPPTASSSGTNTRSVSAAVSDESVAGDSGVFEAAQAGEAGCVNSAQIEIKLRYCSDESALEIGILRARNLHALYIDVGTEVCIRGALVVGGGGSVSFTSRPLVWAGSTLLFRWQQRAALQQRALQGGTLQVNVAAGAECLGCTQVSLADFDPDTVSQKWYNVLSFRSIRRDESSDESTVISSQTSTLTRNRGPESMAAAECNADCCDNSASEDEESREPLNQIVEEDSFEDYIPEEDIHLEDEYLPSTAEKETNTECNFCPEGARQLHRRKSQQVSSNTEESLATIKRSQTFSPQQGVGKGQYLCRLNRSESDSSMSAHRRLTLRPPSLGIPFDRSVRERRSLRWSKSAGRPSRRSGRTSLDLSLDLRAQHERLTDLRNEIAHLTTLKKRIDFKSNDPAVASWVTEDETLQKLLSAPADKDRVARLFTRTCKEVFRLRKSRQGGRKPDLVTFKEKMAFFTRSKSITIADDEELSDDWEELERRTPDGRSSKVSYERGLVVECKNPCIPDKMDGISIDGNNDDVYEYVVDRALGVQV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: