MonarchBase - Protein-coding gene

DPOGS200308
Transcript	DPOGS200308-TA	1344 bp
Protein	DPOGS200308-PA	447 aa
Genomic position	DPSCF300026 - 126506-131315
RNAseq coverage	477x (Rank: top 26%)

Annotation
*Heliconius*	HMEL013484	0.0	90.95%
*Bombyx*	BGIBMGA005584-TA	0.0	80.26%
*Drosophila*	Sans-PB	2e-97	43.49%
EBI UniRef50	UniRef50_Q7QIQ9	1e-97	42.91%	AGAP007027-PA n=3 Tax=Diptera RepID=Q7QIQ9_ANOGA
NCBI RefSeq	XP_001120815.1	2e-103	45.60%	PREDICTED: similar to CG13320-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|340725111	2e-103	45.93%	PREDICTED: Usher syndrome type-1G protein homolog isoform 1 [Bombus terrestris]
NCBI nr blastx	gi\|20129939	2e-97	43.55%	sans ortholog, isoform A [Drosophila melanogaster]

Group
Gene Ontology	GO:0005515	1.1e-12	protein binding
KEGG pathway
InterPro domain	[2-120] IPR020683	1.5e-24	Ankyrin repeat-containing domain
	[371-434] IPR010993	1.1e-12	Sterile alpha motif homology
	[374-431] IPR021129	3.6e-11	Sterile alpha motif, type 1
	[370-435] IPR001660	4.1e-11	Sterile alpha motif domain
	[380-435] IPR013761	3e-10	Sterile alpha motif-type
	[32-61] IPR002110	4.5e-06	Ankyrin repeat
Orthology group	MCL11590		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200308-TA
ATGACTCCGACCTTGTGGGCTGCCTTTGAAGGTCACATAGAGGCACTGCGACTACTCTGTGGCAGAGGGGGTGAACCTGATAAATATGATTACTTCGGCAACACAGCCCTCCACCTAGCAGCTGCACGCGGTCATAAGGAATGCGTGACGTTTTTGGTAAACTTCGGTGCCAACCTGTACGCCATGGACGTAGACGGTCACACGGCCCAGGAGCTGGCCGCCATCAACGGAAGAGATGATATACTGCGTTTCCTCGACCAAACTATCGGCAAACTGGAAAATAACGACAAAAAAAAAGCGAAGTCCCTCAAAGAAAAGGCAAAGAAGGATCACGAGAAACTTCAAAAGCAGTACACTAAGAGGCAGAGTAAGGCGGAGGTGATGGCGGACAAAGAATTAAAGAAACTAGCCAAGGAATGGGACCACGGATACAACGAAGAAATAACGACCATGCCGCATAGACCAAGCAACGTGTTGCTGGCTCTGAAACAGAAAATGACACGCTCCTCGAGTCAAGGTAATCTTCTGGACGATCCTCGTCCGACGTACAGCGCGCTAGTGGGCACGGTGTCGTCAGGGGCTCGAGGCCGAGGCGCCGTCTACAAGAAAGCTCTCGCCAGCAAACTCAAGAACGGCACCCTTGGGAAAACCAGCGTTAGAGACGACTTCAAGGTAGGCGAGGTAGAGACGACAGGTCGTCGCTCGGTGACGTCATTGAGCGGAGTGCGTCGCGACTCAGAGGTCATGTACGTCGGCACCTTCGGAGCCGGTCCTCAACAAAGGGCGCCCGTCGCTGATGTCTTCACTGACAAACCATTACTCACCAGATCAGCGAGTCAACCCGACTTCTTGGCGGCGCAACAGGGGGAAGACAGCGGCATCGGACAGGAAGTGCTGCTGCAGGAACCGGCCAGTATATTTGACAGACCCGGGTTTGGTAGTGTTGCGTTTAGACGTTCCATAACAGCCACACTGAGCGCGATGCCGGCCAGCGAGGAGTTGTCCATAGGATCCGCGGGCTCCCTTGCAAGACACGCTTACCAACCAGCTGAGTGGGCCTCTACACAGTCAGGGAGTTCCACTATAACATCCGACGAGGAACCCGAGGCGGATGACACGGGATACTCGTCACTCGAACGCTTCTTGACGGCGTGGGGTCTGTCACAGTACATCCAGAAGTTCAAGGACGAGCAGATCGACCTTGACGCGCTGATGCTTCTCACCGAGAGCGACATGAAGAGCCTCGGGCTGCCGCTGGGACCGTACCGAAAGTTGGTCACAGCTGTTCAGGAGAGGAAGCAGGCTCTATCCCAACCGGGCCCCATGATAGATACCGCTATATAG

Protein sequence:

>DPOGS200308-PA
MTPTLWAAFEGHIEALRLLCGRGGEPDKYDYFGNTALHLAAARGHKECVTFLVNFGANLYAMDVDGHTAQELAAINGRDDILRFLDQTIGKLENNDKKKAKSLKEKAKKDHEKLQKQYTKRQSKAEVMADKELKKLAKEWDHGYNEEITTMPHRPSNVLLALKQKMTRSSSQGNLLDDPRPTYSALVGTVSSGARGRGAVYKKALASKLKNGTLGKTSVRDDFKVGEVETTGRRSVTSLSGVRRDSEVMYVGTFGAGPQQRAPVADVFTDKPLLTRSASQPDFLAAQQGEDSGIGQEVLLQEPASIFDRPGFGSVAFRRSITATLSAMPASEELSIGSAGSLARHAYQPAEWASTQSGSSTITSDEEPEADDTGYSSLERFLTAWGLSQYIQKFKDEQIDLDALMLLTESDMKSLGLPLGPYRKLVTAVQERKQALSQPGPMIDTAI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: