MonarchBase - Protein-coding gene

DPOGS203338
Transcript	DPOGS203338-TA	1308 bp
Protein	DPOGS203338-PA	435 aa
Genomic position	DPSCF300003 - 212802-217819
RNAseq coverage	266x (Rank: top 40%)

Annotation
*Heliconius*	HMEL017934	8e-165	68.56%
*Bombyx*	BGIBMGA003860-TA	1e-86	70.95%
*Drosophila*	CG9104-PA	1e-92	42.32%
EBI UniRef50	UniRef50_Q9VXA0	2e-90	42.32%	CG9104 n=27 Tax=Coelomata RepID=Q9VXA0_DROME
NCBI RefSeq	XP_001664256.1	1e-107	44.93%	hypothetical protein AaeL_AAEL003870 [Aedes aegypti]
NCBI nr blastp	gi\|157138567	2e-106	44.93%	hypothetical protein AaeL_AAEL003870 [Aedes aegypti]
NCBI nr blastx	gi\|312377479	5e-91	42.35%	hypothetical protein AND_11201 [Anopheles darlingi]

Group
KEGG pathway
InterPro domain	[19-190] IPR009348	3.8e-55	Nitrogen permease regulator 2
Orthology group	MCL10638		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203338-TA
ATGTCCTCAAAAATTATGGAAACACGTTATTACGAGGGATGTGGACGAGAGGGTCCCATCCGCTGCATCTTCCTGGGGGAGTTCCATCCGGTAGCAGGACCCAAAATATCGTGCCAGTTTCCTGAAGACTATGTGTCTAAGGAGCTGTTTGATTCAATAAGTGCTTACATCATTCCAAAACCACAAATACAGAAATGCACAATGACAATTAACGCCCTCGGTCACAAAATCATCGGCTATCCAATACGAATAGAAAACTCGAGGTATGAACGGAACATGTATCTGTTCAATCTCTGCTTTGTCTGCGACAGTTGGTCGAAGACCGTTCAGTATGAACCCGTTGTGAAGAAGCTCGGAGAGCACTTGACGATCATGGAAGAGGAGACCCGTTTTGTTTCAAGTGGCTCCAGCAAACTGCCGACCCTGCTTGCACACTTACTCCACGATCTGAACACTTATAGGAAAGCGACGCTCGTTGAGGGCGACACGGTTATGCACCTCAAAGTACTGGAAGTGAGAAAAGATCCAACCCCCGTCCATGATTTTGATGTTCCTGTACTGGTGGCTTCGGTAGGGCTTCCGCGACCGGGGCGCCCGCCGCGTGTGCCCCCCGGACCACAAGAGGAGTCCGAGCAGAGCCAGGAACACATCGAAGTTGAAGAAGAACCCTTTGAGGTGCACCTAGACGCCGACTGGGATCTCACAACAAGACAGCTTCTTCCTCACATAAACGGTTACAACCACATCTCGAAGATAGCTTCGGACACCAACGTTGAAAAGACACTCGTCAAGTCGTGTATACAAAACTTGGTGTACTACGGAGTGGTGACTCTGATACCCGTGCTCAAGTTCAGCAACATGTACCGAGCCACACCTAACCTGAGCCGATTAATGAACGATCATGACATGCAGCACTCGTGTCTGAAGTACATCAACAACGACTGTGAGGGGAAGGACAAGCCGTCACTGTCCGACGTGGTGGGTGTGCTGTGTTCACTGCAGCAGGGTACAACGTTGCGTGCGGTGTGCGATCGGCACTTCACATCCCCCGGGGTGCCGTTCGATGTGAGACGGCTGATAGTGTTCGCACAAATACACGGCCTCGTAAAGTGTCTTAAGAGGTATCCAGTCTATATCCGGAACCCGACACGTCAGAACGGCTACAGAGTCGACTCTATAATAGGTATACGAAGGCTGTTCACTGGCAGGCACAACGTGGACGAGATATGCTGCCTAGCCCGCATTGACCTCCCTACCCTCGATCAGATTATAGAAGACGATCCCAACGTTATTATAATATGGAGATAG

Protein sequence:

>DPOGS203338-PA
MSSKIMETRYYEGCGREGPIRCIFLGEFHPVAGPKISCQFPEDYVSKELFDSISAYIIPKPQIQKCTMTINALGHKIIGYPIRIENSRYERNMYLFNLCFVCDSWSKTVQYEPVVKKLGEHLTIMEEETRFVSSGSSKLPTLLAHLLHDLNTYRKATLVEGDTVMHLKVLEVRKDPTPVHDFDVPVLVASVGLPRPGRPPRVPPGPQEESEQSQEHIEVEEEPFEVHLDADWDLTTRQLLPHINGYNHISKIASDTNVEKTLVKSCIQNLVYYGVVTLIPVLKFSNMYRATPNLSRLMNDHDMQHSCLKYINNDCEGKDKPSLSDVVGVLCSLQQGTTLRAVCDRHFTSPGVPFDVRRLIVFAQIHGLVKCLKRYPVYIRNPTRQNGYRVDSIIGIRRLFTGRHNVDEICCLARIDLPTLDQIIEDDPNVIIIWR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: