MonarchBase - Protein-coding gene

DPOGS204547
Transcript	DPOGS204547-TA	3012 bp
Protein	DPOGS204547-PA	1003 aa
Genomic position	DPSCF300297 + 81805-102775
RNAseq coverage	108x (Rank: top 60%)

Annotation
*Heliconius*	HMEL017594	0.0	83.30%
*Bombyx*	BGIBMGA005337-TA	0.0	80.50%
*Drosophila*	Liprin-gamma-PC	4e-167	54.20%
EBI UniRef50	UniRef50_D6WE19	0.0	46.08%	Putative uncharacterized protein n=3 Tax=Endopterygota RepID=D6WE19_TRICA
NCBI RefSeq	XP_969578.2	0.0	49.18%	PREDICTED: similar to AGAP007137-PB [Tribolium castaneum]
NCBI nr blastp	gi\|270004925	0.0	46.08%	hypothetical protein TcasGA2_TC010503 [Tribolium castaneum]
NCBI nr blastx	gi\|270004925	0.0	47.44%	hypothetical protein TcasGA2_TC010503 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	2.1e-14	protein binding
KEGG pathway
InterPro domain	[668-727] IPR021129	1.7e-14	Sterile alpha motif, type 1
	[661-735] IPR010993	2.1e-14	Sterile alpha motif homology
	[671-732] IPR013761	3.7e-12	Sterile alpha motif-type
	[751-819] IPR011510	2.7e-09	Sterile alpha motif, type 2
Orthology group	MCL11899		Single-copy universal gene

Nucleotide sequence:

>DPOGS204547-TA
ATGGCGCTTGTGCGCCGTATATTAGGCGACGCCCAGGCGAAACTTCGCAAGATGGTGGACGAGCAAGTGTCAGTTGGCACAAGGGTAGAAGCGGATGCAGAACCAGAGCCCGCAGACCCTCTTATCACTCCAGCATGTTCTGCACTCGATCGAACTGACGATCCTCGACCAATTCCACCCGAACGAAGATTCCTCATCAGCACTCTTGATAAACCTCGCAATAGTTCGCTGAATGGGGACAAAGATTCTACATTGAATCGGTCTGCTCGAATATCAATAAAAAATGGAAAGGAAAATCCTTTTATCGCCTCTTCACCAGATGACGATAACAAAGAAAATCAAACAAATGGTAAACTAGATTCACCGATCAAATGGTCCACTCAAAATGGTAGCGATAGTGGAACTTATGCTGAGATTGGGACAGGAGCAAACAGTAACACCAGTGAGAAAAATATTCTGGATCCAGCGGACAGCTCTGAAGAAGAAGTTCCTCTACCAGATGCTACGTCTCCGGGAAGGAGCAGTGAAGGCCCTGAGCCCAGAGCTGATATTACTGCATCTCTTGAGGGAGGTTCAGGGTCCCCAGGAGGTCGGTCGGATCGTTCCCGTCAGGACGAAGTACCGGCATCTCCAGGAATGTTAACAGCTGCACAGTTGGCGCGCCGACTACGTTTAGAAAATGAGCGCCTGCAGGTAATTTTGTTTATGATATTGGCACATCTGGTATTCCTTAACCGCCAAATATGTACCAGTGTCTATATACAGCTGTCGATAGAGCCTCTAAAAGCCGACAAGAAACGGCTCAAAGCGGAGAAATTTGATTTGCTGAATCAAATGAAGCAACTCTACGCCACTCTTGAGGACAAAGAGAAGGAGCTTAGGGATTTCATCAGGAATTATGAACAGATGCGGTCTCGAAGCGGTGCGTCCTCAGCGCTGGGTGCAGAACGAGCTGAACGCGAACGCGAGCGTGCGGCATTGTTGCGGCATGCCCGCGACGAGGCCGAGCGCTCTTTACAACTGGCGGCCGCACTCAGCGCCCGTGATACGCAGTTGCGGCATGCTAGGGAACAGCTTTTTGAGGCTCGAAGACAACTACAAGCAGCAGGGTGTTTGTCCGAAGGTGAGAGTGTAGCGTCTTTGGGAATTGGTCCTCCAATGATGCTTGGAGGTCCCACGGGTTTGATGGGTGATAGAGGTAGCTGCAGCGCAGATTCTGGAGTTAGAGGTAGTAGCGATGGTGGCGCCACGTCGGTTTGCGGCGGAAACCTATCAGACTCCACCGCAGAGGGCGCGCCTCCCACCCTCGACCCATACGATACAGATGCTGTATCGCTGGTGTCATCCGCGCACCCTATATACCAATTAAGCACGCCCCGTGACTGTAGCCCGACTCTCTCACCACATAACAGCGGTTCATCATTCACAAGATCTATTGATGCTGGATCACTATCTAGGTCAGTTGAGCAGTTATCGAGTCCGGGGGAATGTGACTCTGGTATGGTTGGGATGCGGACCCGTCCTGGGGGTTCCAAGGCCGGCCGCGGTCGGGGATCCGCTTGGGGATCCATATCTCGCGTTTTTGCTAGAAGCAGACACCGCACCAAGTCCGGAAGCGCAGCCAGTAGTGGTCACGAGAGCGAGCCAATATACGCTGGCACAGGCAGCACAAGTCGCGCTTGGTCTCCTTTAGGGAGTGAGGCGGCATTACGCGAAGCTGCCTCTCTACCTCTATCAAGATGGCGGGCACCAGCCATCATCGCCTGGCTTGAACTTGCTCTTGGCATGCCGCAATATGCAGCTGCTGTTGCTGATAATGTTAAAAGTGGAAAGATCCGTGCTTTGAATGGGCAGGTTCTGCTCGAGTTGACGGACACGGATCTTGAGGTCGGGTTGGGGGTGACTCAGCCAATGCACAGGAAGAAGCTGCGGCTGGCCATCGAAGAGAGACGGCGGCCGGACCTCGTACGGAACCCTAGCATCGGACAGCTGAGTCATGCATGGGTTGCGGCGGAGTGGTTGCCAGATCTAGGGCTATCCCAGTACGCAGAATCATTTTTAGCCAATTTGGTGGATGCTAGAATGCTGGATACTATCAGCAAGAAGGAGCTGGAGAAATATCTTGGTGTTACGAGAAAGTTCCATCAGGCATCCATTGTCCACGGCATTCATTTGCTACGAATCATGAAATATGATAGACAAGCACTGGCAGTACGGCGGCATCAGTGCGAAAATGTCGATGCGGACCCTCTGGTTTGGACCAATCAAAGGTTTATGCGTTGGTCTCACAATATCGACTTGGGTGAATTTGCTGAGAATCTTAAAGACAGCGGTGTCCATGGTGGTTTGGTGGTACTGGAACCATCATTCACTGGTGAGACCATGGCCACGGCGCTTGGTATACCACCGTCGAAGAGTATAATTCGAAGGCATTTGGTAGCTGAATTTGATGCCCTTGTCATCCCAGCGAGGAATATGTTTGGTCACCAAATAAGGATGTTGGGAAGACCGTTTTCAAGATCGGTTGCGACAGGCTTGCCTGGAATTGACTTTAGCGCTGATTCTAGACGACATAGTCTAAGGGGCTCTATAACACGAGCGTTGGGTGTTCTCAAGCCGAAGCACGATAGACCATCACCATCTAGTTCAAGCGAGAGTTCTAGCGTGATGAGTCTGACACAACCGTACATATCTTATTCACCTCCTATAGCAGTGCGGACGCTGTCTCAATTGAGCATGACATACGCTCCACCACCGACACTGGCAGAGTATGAACCGATATATACGCCTTTGAGTTTATATTCCCAGTCTAGCGTATCCACAAAGGATAGCCTTCAGCGCCTTAATGATGGCAAAGATTATAATATCACCCACAGGTACGGACAAAAAGTAGATCAATCTCATCGAGTCAGTTCACCGTTACCTGAAACATCTGACGGAAATAAGCAAAGACGTCACAGACGAGTGAAAAGTATAGGAGATATTAATGCTTCGAGCAAAACGACGGTTTAA

Protein sequence:

>DPOGS204547-PA
MALVRRILGDAQAKLRKMVDEQVSVGTRVEADAEPEPADPLITPACSALDRTDDPRPIPPERRFLISTLDKPRNSSLNGDKDSTLNRSARISIKNGKENPFIASSPDDDNKENQTNGKLDSPIKWSTQNGSDSGTYAEIGTGANSNTSEKNILDPADSSEEEVPLPDATSPGRSSEGPEPRADITASLEGGSGSPGGRSDRSRQDEVPASPGMLTAAQLARRLRLENERLQVILFMILAHLVFLNRQICTSVYIQLSIEPLKADKKRLKAEKFDLLNQMKQLYATLEDKEKELRDFIRNYEQMRSRSGASSALGAERAERERERAALLRHARDEAERSLQLAAALSARDTQLRHAREQLFEARRQLQAAGCLSEGESVASLGIGPPMMLGGPTGLMGDRGSCSADSGVRGSSDGGATSVCGGNLSDSTAEGAPPTLDPYDTDAVSLVSSAHPIYQLSTPRDCSPTLSPHNSGSSFTRSIDAGSLSRSVEQLSSPGECDSGMVGMRTRPGGSKAGRGRGSAWGSISRVFARSRHRTKSGSAASSGHESEPIYAGTGSTSRAWSPLGSEAALREAASLPLSRWRAPAIIAWLELALGMPQYAAAVADNVKSGKIRALNGQVLLELTDTDLEVGLGVTQPMHRKKLRLAIEERRRPDLVRNPSIGQLSHAWVAAEWLPDLGLSQYAESFLANLVDARMLDTISKKELEKYLGVTRKFHQASIVHGIHLLRIMKYDRQALAVRRHQCENVDADPLVWTNQRFMRWSHNIDLGEFAENLKDSGVHGGLVVLEPSFTGETMATALGIPPSKSIIRRHLVAEFDALVIPARNMFGHQIRMLGRPFSRSVATGLPGIDFSADSRRHSLRGSITRALGVLKPKHDRPSPSSSSESSSVMSLTQPYISYSPPIAVRTLSQLSMTYAPPPTLAEYEPIYTPLSLYSQSSVSTKDSLQRLNDGKDYNITHRYGQKVDQSHRVSSPLPETSDGNKQRRHRRVKSIGDINASSKTTV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: