MonarchBase - Protein-coding gene

DPOGS203023
Transcript	DPOGS203023-TA	3027 bp
Protein	DPOGS203023-PA	1008 aa
Genomic position	DPSCF300068 + 473684-487955
RNAseq coverage	444x (Rank: top 28%)

Annotation
*Heliconius*	HMEL011042	0.0	61.50%
*Bombyx*	BGIBMGA012260-TA	3e-127	66.22%
*Drosophila*	Br140-PA	1e-39	48.37%
EBI UniRef50	UniRef50_Q9VI63	1e-116	85.51%	AF10 n=23 Tax=Eumetazoa RepID=Q9VI63_DROME
NCBI RefSeq	NP_524250.3	2e-117	85.51%	alhambra, isoform A [Drosophila melanogaster]
NCBI nr blastp	gi\|45549216	4e-116	85.51%	alhambra, isoform A [Drosophila melanogaster]
NCBI nr blastx	gi\|91082411	7e-162	39.16%	PREDICTED: similar to mixed-lineage leukemia protein [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.4e-07	protein binding
	GO:0008270	1.4e-07	zinc ion binding
KEGG pathway
InterPro domain	[12-96] IPR011011	3.1e-14	Zinc finger, FYVE/PHD-type
	[24-79] IPR013083	1.1e-08	Zinc finger, RING/FYVE/PHD-type
	[29-77] IPR001965	1.4e-07	Zinc finger, PHD-type
	[30-78] IPR019787	7.5e-07	Zinc finger, PHD-finger
Orthology group	MCL18915		Insect specific

Nucleotide sequence:

>DPOGS203023-TA
ATGTTACGTAACGAACCGGCGCAGAAGGTGGTGTGCAATAATGCTTCCTTCAATATGAAGGAGATTATGAAGGAGATGGTTGGTGGTTGCTGTGTGTGTTCCGACGAGCGTGGTTGGCCTGACAACCCGCTGGTCTACTGCGACGGCAATGGATGTTCGGTTGCAGTACACCAAGCCTGCTATGGAATCATTGCTGTTCCGACCGGTCCCTGGTACTGCAGGAAGTGTGAGAGCCCTGAGACTAAAAGCAAAGTGAGATGCGAGCTGTGCCCGTCTAAGTTGGGTGCGTTGAAGCGTACTGACACAGGTGGCTGGGCCCACGTCGTATGCGCTCTCTACATACCAGAGGTGCGTTTCGGGAACGTGACTTCTATGGAGCCGATTGTCCTGCGACTCATTCCCACCGAGAGATATAATAAGACTTGCTACATCTGCCAGGATCTTGGCAAAACTCATCGCGCCAACGCAGGCGCCTGCATGCAATGCAACAAATCTGGTTGTAAACAGCAGTTCCACGTGACCTGCGCCCAGTCCCTCGGCCTGTTGTGCGAGGAGGCCGGCAACTACCTGGACAACGTGAAATACTGCGGTTACTGCCAACATCACTACAGCAAACTGAAAAAAGGCGGTAACGTGAAGACCATCCCGCCGTACAAGCCGGTCAGTCACGATAGCCGCAGCGACTCGAGCGAGAGGGAGGGGGAGCCGCCGACGACGCACTGCAAGCGAGGGCCCGGCCGGAAGTCGTCTCACTCCAGCGGCGGCGCGTCCGGGAAGAACACGCCCAACTCGTCCAAGACGCCTACGAACACATCCCAACCGATGGACAAGAAGAAGCCTTCACCGTCTCGTCGAGGATCTGTGGCTGAGAGCGGCAGCAAGACCAATACACCAGCCCCCTCACCCTCGCCGCAACACATACAGGAGACACACACTAAAGGAGGTTGTTCTACGCCCATCAACACCGCTAAGATCCCCTTGCCGCCGGAGTCTCCTGGCAAGGAAGGCATGATCAGCTCAGCGGCCATAGCATCTATACCCATACCCCCGAGCACTTCAACAACGACTGTCGTGCAACCTACCAAGCCGTACGAGTCCGTCATCACCAACACGGAGACGGCTGATGCTAAACAGACCAAGAAAAGGAAGGCTGTTCAAGGTTCGCAGTCGGCCGTGGACTATGCATCATCACCGACGCCCGTGGAGGTCGCGAACCAGATCGGGAACAACACTTGGGAACAACAGACCAGCCACGCAACTAGCGACACTAATGTGGAAGTAGAGAAGATTATTAAAAAGGCTAAAACTGAAGGTATGGACGGCGGGTCATCGTCAGCTGGTCACTACACCAGCGTGAGCCCGGCTCCGCCGCCGCCGCCGCCGCCCGCCCACAGCCCGGCGTCACACACCTCGTTACAGAGCCCTAGACATCTCCCCAGTCCGATGCCAGGGCCGAGCGGGATCAACCAGGCTCCCAACATCAGATCGCCTTCGCAGCACCAGATGAAGGAGCGCGAGCCGCCGGCGTCGCTGCTGGTCTCCGTGCCGCTGCCTTCAGCCAGCCACGGCCTGAACCTGTCCGCGCACGCGCACGCCCTCATGCACGCACAGATCCCGCTGCCGTCTCCAATGCCAGAGATGGGGCATATCTTCCATCAGACCCACAAGCAGGTGGCGATGGAGTCGGGGCTGAGTCACTCACCCCACGCTCGGTCCTGGGGCGGTCTGAACGTCTCCTACGAACTACAGGATCCAAACAAACCCGGTGTGAGCGGTATAGCTGGGCCCAGCAAGGAGGCGCTCGTCGGCGCCAACATGGCCAATATGGCCAATATGGCCAACATGGCTAATATGGCGAACATGGCAAACATGGCGAATATGGGCATACCGCCAGCCTTACGGAACAAGAAGAGAGCAGCACTAGCCACGTCCACGGCGAACACCCCGCCGCCACCGCCGATGCAGTCAACCGCAGCTCAGAACCTGAGCGGGATGCGGAGGGGACCCCAGCCGACCCCGCCGCCCGTGTATCACGAGGCAATCAAAGACTCTCCTCCGAGCTCGCCCGGCTCCGAGAGACCGCTGAAACCTAAATTGGAACACAAGTTGGGTGTGAACTGCTCGGCTCCTCATATGCTCGGTAACGAGCTGAACCCGGAGAGCGGAGCGGCGGCTCGTCTCCAGGAGCAGCTGACGGCCGAGCTGGCTGCCCACGCGGCCGGCGCCGTCAATTCAGCTGACACGCCCATACCGCCGCCCCTCATCAACAAGGCCGCTCCGAGATCCGGTGCTCAAAGCCTGGATCAGCTCCTCGAGCGACAATGGGAACAGGGCTCGCAGTTCCTCATGGAACAAGCACAGCACTTCGACATAGCGTCGCTGTTGTCCTGCCTGCACCAGCTGCGGACGGAGAACGTCCGCCTGGAGGAGCACGTCGGCAATCTCCTGCAGAGGAGGGACCACCTGCTGGCCGTGAACGCACGCCTCGCTATACCACTAGCTGTGGTGAGTGGACCCGGCGAGCCAGTCAGATGCGCTCGCGAGAACGGATCAGGCCTGAGGGCTCCTTCCGTCCCGGGACGACCAGCTGACAATGTAGCCTGCGATCGACATCAGGTAATGATAACAAATATACCTCTATATATAATAAGTGCTCCAGTTGATTCGTACGGCGGGGGGGGGTCCGTCAGCCGGCGAGGCGGCGAGTACGGCGACCTGGCCGACACCGACATGGTCGACGTGGAGAATGTGAGCGATATGGACTATGTGGACCGTGCTTACCGGCCGGGTGGTGGGGTGCTGGGGCCGGGAGAGGTGAGGTGGGCTCACGGATACGCCCTGCCCGGGGAGCCCGGCCCGAGCGGGCTGGCGGCGGGCGCTGTAGTCCCCGCGGCGGGGCGACTCGGCGGCCCCGACGAGAACGGACACGGAGCCCTGCGGACGGTCAGGGCCTTCATAGTACTGGAGCAGCGAAGGCGAGCCAGGAGCGACTTCTCCATCGACGCCATACTGGCGGCTGACTACTGA

Protein sequence:

>DPOGS203023-PA
MLRNEPAQKVVCNNASFNMKEIMKEMVGGCCVCSDERGWPDNPLVYCDGNGCSVAVHQACYGIIAVPTGPWYCRKCESPETKSKVRCELCPSKLGALKRTDTGGWAHVVCALYIPEVRFGNVTSMEPIVLRLIPTERYNKTCYICQDLGKTHRANAGACMQCNKSGCKQQFHVTCAQSLGLLCEEAGNYLDNVKYCGYCQHHYSKLKKGGNVKTIPPYKPVSHDSRSDSSEREGEPPTTHCKRGPGRKSSHSSGGASGKNTPNSSKTPTNTSQPMDKKKPSPSRRGSVAESGSKTNTPAPSPSPQHIQETHTKGGCSTPINTAKIPLPPESPGKEGMISSAAIASIPIPPSTSTTTVVQPTKPYESVITNTETADAKQTKKRKAVQGSQSAVDYASSPTPVEVANQIGNNTWEQQTSHATSDTNVEVEKIIKKAKTEGMDGGSSSAGHYTSVSPAPPPPPPPAHSPASHTSLQSPRHLPSPMPGPSGINQAPNIRSPSQHQMKEREPPASLLVSVPLPSASHGLNLSAHAHALMHAQIPLPSPMPEMGHIFHQTHKQVAMESGLSHSPHARSWGGLNVSYELQDPNKPGVSGIAGPSKEALVGANMANMANMANMANMANMANMANMGIPPALRNKKRAALATSTANTPPPPPMQSTAAQNLSGMRRGPQPTPPPVYHEAIKDSPPSSPGSERPLKPKLEHKLGVNCSAPHMLGNELNPESGAAARLQEQLTAELAAHAAGAVNSADTPIPPPLINKAAPRSGAQSLDQLLERQWEQGSQFLMEQAQHFDIASLLSCLHQLRTENVRLEEHVGNLLQRRDHLLAVNARLAIPLAVVSGPGEPVRCARENGSGLRAPSVPGRPADNVACDRHQVMITNIPLYIISAPVDSYGGGGSVSRRGGEYGDLADTDMVDVENVSDMDYVDRAYRPGGGVLGPGEVRWAHGYALPGEPGPSGLAAGAVVPAAGRLGGPDENGHGALRTVRAFIVLEQRRRARSDFSIDAILAADY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: