MonarchBase - Protein-coding gene

DPOGS209317
Transcript	DPOGS209317-TA	2823 bp
Protein	DPOGS209317-PA	940 aa
Genomic position	DPSCF300234 - 28895-35963
RNAseq coverage	1343x (Rank: top 9%)

Annotation
*Heliconius*	HMEL018077	0.0	52.95%
*Bombyx*	BGIBMGA013819-TA	6e-177	91.53%
*Drosophila*	CG6282-PA	4e-129	72.13%
EBI UniRef50	UniRef50_Q7Q6P7	2e-135	71.75%	AGAP005737-PA n=5 Tax=Culicidae RepID=Q7Q6P7_ANOGA
NCBI RefSeq	XP_393140.1	2e-136	73.79%	PREDICTED: similar to CG6282-PA, isoform A isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|328784034	9e-136	69.58%	PREDICTED: hypothetical protein LOC409642 isoform 2 [Apis mellifera]
NCBI nr blastx	gi\|328784034	2e-131	70.81%	PREDICTED: hypothetical protein LOC409642 isoform 2 [Apis mellifera]

Group
KEGG pathway	lla:L176238	4e-23
	K12343 (SRD5A1)	maps->	Steroid hormone biosynthesis
InterPro domain	[646-885] IPR010721	2e-76	Protein of unknown function DUF1295
	[459-562] IPR000859	1.8e-08	CUB
Orthology group	MCL16025		Insect specific

Nucleotide sequence:

>DPOGS209317-TA
ATGTTCAAAACTTCTATATCTTTGGCTCTCGTGGCCGTCGTGTTGAGTGTCGTTTTAGCTGATGACAGTGACCAGAAGGAGACCTGGTATGATGATTACTACTTAGGAGACCTTGACGATAAAGAGATCTTTCAGCCTTTTACATCGCTACATAGAAGTACTATATCAGATGGTAATGAAGACCTACCAGCTGAAATTAAAGACACCGATGATCTCTCCTCCGATATAAATGAATACAACGAAGAAAAGAAATTCGAGGATGAACTGAAAAGGTACGTGATTGACAGGAAAAGTGACGCTCAGGATGATAGTAGCTTTGATGACTACCAGTTCGAAGATAATAGATTTGGTGACGATAACTCATACGGTGATGATCAAAGTGATGAATTTAATCCACTTCTAAATAAAGAGTTACAAGTTGAGACTGACAAAGAAAAACATGTCGAAGCATCGACTGAACTGCTAAATGATTTATCAAAAACAAATAAGAGTACAGATAAAGATATTCTAGAGGAGACGAAATCAATTTTAAGTGAAGAGACGATAAACGATTTCGCTCATGATAAAACATTTGGAGCGAATGTTGTAAATGATACTGAAAGCGGGCATATATTAGAGGAGACCAGAAAAATTATAAACGAAAATTATGGATCAATAGAAGACAATATCGACAAAGATGGTGGTGAAGAATCGATCAGAGATTCTGAAACTGAAGAAGATCATAGGACAATGATAACAACATCCGAAGAAGGAGGAGAGAGAGAGGAAAAAGGAGACACCATCGATACAGCTTATAGTGATATAATGCACGATTTGAACAGACTCCATGGAACATGGAAAAAATTAAACGAAGTTGGCGATGACGTTGATGATAACGATTACAGTGAAAGTGAGGAACAACAGGAAATGGACGGAGACTACGAAGAAATTGGTGATTCAGAACTTGAGAGAATATTTGAAAATAGTTCCAACAATGAACAAGAGAACGTGGAAGCTTCTGATGAAATACTCTCTGACGAGACATCTGCAAGTCATGCAAACACTTATAAACCTCTGCCGTACATAAACGATGCGTTAGTGGCGAGCGATGTAGACAGAAGCTTACCAAAGAGTACTAACGATAGCAGTGATAGTAACAATGCTAGCAGCACAGAGGAGTCAAGTGTCACGGAGAGCTCCAAGGCTTCTGGAACCACTGAGTCCATGTCTACAACCGAAGCAGTGGAAACAACATTAAAATCAGAAATGAATGAAATGTCGATTGCCGAGGAGGACGCCGCCATCTTGAAGTTTACTGAAGTCAATCCCTCGATACTAGATGTCACATCGAGTGATATCATTAATGCAACTAACGTTTGGCTGACAGTGAACGGTTCCGTGGAAGTGACGTCACCCGACTATCCCTCTCCGTACCCCACGAATAATACCGTGGACTGGATGTTCCAAGGAGCCGGCCAAGGAATAGAATTAAATATAACGGAATTCTCCGTCAACGGTTACCTCGGGGACTACCTGTTGGTTAAACCAGGTGGAGTGGACACGTCGGGTTCTTCGGGCCTCATCTTCACCTACTCGCTACGGACCGAGCGTCGCTACAGGTTCTTGGACGTCGATAAGATGTTCGTGCGTTTCGTGGCCAAACCTGGAAACCAGTTATTCAGAGGGTTCAAGTTCAGCGCCCGTATGGTCGTCGATCGACCAGAGTCGATACCTGAACCCGAGGAGGACGTTCCCGCTCCCGTGTCTCCCGCCACCATCACTGTCAACCTGGGCGGGATCTCACTCCAGGATTTCCATGGGGTCGAAGAACAGTTCCGTCGGATCATCGCCGACATGGCCACCTTGTATATCAACACCAACGACATCGACGCTGGACTCAACGCTACGAACAACTTCGCAGTAAGTGCTATAGTAACCGTGGCCATGCAGATACTATTCTTCACCATCGCTTCTTTGTCTCAGAGTGATAAAGTAACAGATTTTACTGGAGGTGCTAATTTTATTATTATAGCGTTATTAACATTCTTCCTCGGCCAAGGTGGGAACACTCTCAAGAACTATGACAGTAGGCAACTGATGGTCACCGCGTTCATATGCGTGTGGGGCGTGAGGCTGTCGGGGTACCTCATATACAGGATCTATCACATCGGCAGAGACAAGCAGTTCGAGGATCGTAAGAGCAACACTCTGAGGTTCGCCGTCTTTTATACTTTCCAAGCTGTGTGGGTGTACGTGGTCAGTTTGCCAGTCATCATTATAAACTCACCGCATCACTCCTACCCCAAGGCGCCGAAGACGATGACGACGTTAGACTCGGCCGGAGCCGGTGTTTTCGTCATCGGATTGTTGATCGAAACTTATGCAGATTTACAAAAATTTGCATTCAGACAGGAACCAGCCAATCAAGGAAGATGGTGCAACGACGGCCTCTGGGGACTATCACGACATCCCAATTATTTTGGTGAGGTCGTTCTCTGGTGGGGCATATTCATAATATCATTGAACATCATAGAAGGCGTCGAATACATTGCTGTGTTGTCACCATTGTTCACGACAGCAATAATATTGTTTTTATCTGGTATACCGTTACTAGAAAGATCAGCGGACGAAAAGTACAGAGATAACCCAGACTATCTATACTATAAAGCGTCGACGTCCCCCTTCATACCGATACCGCCCGCTATCTACGTCGAGGTGCCGAGGTTCCTGAAATGTATGTTGTGCTGTGAGTTCCCCATCTACGACTCCACCGGCGACGAGTTCCCCGCGCCTACCATCGTCACCGAGACCACGAGCATATCGATGGTGCAGTCGCAGACATAG

Protein sequence:

>DPOGS209317-PA
MFKTSISLALVAVVLSVVLADDSDQKETWYDDYYLGDLDDKEIFQPFTSLHRSTISDGNEDLPAEIKDTDDLSSDINEYNEEKKFEDELKRYVIDRKSDAQDDSSFDDYQFEDNRFGDDNSYGDDQSDEFNPLLNKELQVETDKEKHVEASTELLNDLSKTNKSTDKDILEETKSILSEETINDFAHDKTFGANVVNDTESGHILEETRKIINENYGSIEDNIDKDGGEESIRDSETEEDHRTMITTSEEGGEREEKGDTIDTAYSDIMHDLNRLHGTWKKLNEVGDDVDDNDYSESEEQQEMDGDYEEIGDSELERIFENSSNNEQENVEASDEILSDETSASHANTYKPLPYINDALVASDVDRSLPKSTNDSSDSNNASSTEESSVTESSKASGTTESMSTTEAVETTLKSEMNEMSIAEEDAAILKFTEVNPSILDVTSSDIINATNVWLTVNGSVEVTSPDYPSPYPTNNTVDWMFQGAGQGIELNITEFSVNGYLGDYLLVKPGGVDTSGSSGLIFTYSLRTERRYRFLDVDKMFVRFVAKPGNQLFRGFKFSARMVVDRPESIPEPEEDVPAPVSPATITVNLGGISLQDFHGVEEQFRRIIADMATLYINTNDIDAGLNATNNFAVSAIVTVAMQILFFTIASLSQSDKVTDFTGGANFIIIALLTFFLGQGGNTLKNYDSRQLMVTAFICVWGVRLSGYLIYRIYHIGRDKQFEDRKSNTLRFAVFYTFQAVWVYVVSLPVIIINSPHHSYPKAPKTMTTLDSAGAGVFVIGLLIETYADLQKFAFRQEPANQGRWCNDGLWGLSRHPNYFGEVVLWWGIFIISLNIIEGVEYIAVLSPLFTTAIILFLSGIPLLERSADEKYRDNPDYLYYKASTSPFIPIPPAIYVEVPRFLKCMLCCEFPIYDSTGDEFPAPTIVTETTSISMVQSQT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: