MonarchBase - Protein-coding gene

DPOGS210089
Transcript	DPOGS210089-TA	2103 bp
Protein	DPOGS210089-PA	700 aa
Genomic position	DPSCF300017 + 523826-531047
RNAseq coverage	517x (Rank: top 24%)

Annotation
*Heliconius*	HMEL015480	2e-155	70.07%
*Bombyx*	BGIBMGA012670-TA	8e-144	59.54%
*Drosophila*	CG31694-PA	2e-64	37.12%
EBI UniRef50	UniRef50_E2AMV6	9e-63	36.34%	Interferon-related developmental regulator 1 n=8 Tax=Neoptera RepID=E2AMV6_CAMFO
NCBI RefSeq	XP_002066947.1	1e-65	38.48%	GK24748 [Drosophila willistoni]
NCBI nr blastp	gi\|289739863	1e-65	39.31%	interferon-related protein PC4-like protein [Glossina morsitans morsitans]
NCBI nr blastx	gi\|289739863	3e-64	39.41%	interferon-related protein PC4-like protein [Glossina morsitans morsitans]

Group
KEGG pathway
InterPro domain	[315-599] IPR007701	1.3e-63	Interferon-related developmental regulator, N-terminal
	[663-696] IPR006921	2.9e-10	Interferon-related developmental regulator, C-terminal
Orthology group	MCL14872		Single-copy universal gene

Nucleotide sequence:

>DPOGS210089-TA
ATGCTGGTTACAGCGCTGTTCCTACTGACGAGCCTGGCACAAGCACGACCGTTCAACATCACACACCTCATAGTGCCGGAAGTCATAGCTCCGGGACAGGAAGAAGTTGAGATCGAGTGCAGATATGACGCTAACTTTACATTACTCAACTGGTTCAAAGGGCCTAACGAATTCTTCAGATACAGACCGGGCGCAGCTCCCAGCACGAGATCATTCCCAGTTCTTGGAGTCGGGAGAGTCGAGCTTATAATTTGTGGACCGACGGCGTGCAGGTTGAAACTCGGCTCACTCACAGAGGAGGCGACAGGGTTGTACAGGTGTGACATCGAGAGGGATGTGCCACCTTATAAATTTGCTACTCGGACGGCCTATATGGAAGTTCACGGACATGAGCACAGAAAGCCATTACTCGAGGGGCTCGATGAGGAGTTCGGCGAGGGAGACGACATGCAGGCGTACTGTCGAGGAGATCCAGAGACGGAGATACGGTGGTATATAAATGGAAGAGAGTTAGAGGAGATGCGAGGAGCCAGCTCCTTGAAGAGGAAAAGCTCCCGCTTGATCTTCCTAGGAATCCCTCCCATGGTTACGGTGCAATGTGCAGAATACAAATTTGGGAAATTGTTTGGTTCTAACGAAGAGAGAGCTCGATGGAAAGATCATGTGGGCAGTAAGGATGAGAGACCCCAGGAGCAAAGGAATCTCTCAGCTGCAGTGGATATGAATATTAAGCATAGAAGAACTGAGTTGCCATACTCATCAGACGAGGATGCTGGAATTGATATGACCAATGACAACTACTCAGAAACATCGGGACAGTCGGACTTGAGGAGTCACGACGATGCGGGATATCAAGTCGCTCTGAGAAGCCGTCAGGGCAGACCGAGATATCCACCTCTATCAGTGCATAAACCTACGTCGTTTACATACCCATTGTCGGAATTGAATAATGAATGCACGGAAAATGAAATTCAAGAAAAATTAGAAGAGAAAGTGCTAGAAATCATTGATGCGCTTAGTGCTAGAGCTAACGCGGCTCGCGCTGCCGCTCTGGTTGCGCTACGTAATGCTTTACAAAGACGTTACCTGGCTCATTTATTGAGCGGACAGAGGGTCACACTAGCCGAACACATCACTAAGGCTTTGAGGAGAGGCAAAGACGGAGAGAAGAAGGCCGCGGCCGCTGTCGCACCGCTATTGGCTTTACAGATTGGTGAAGAAGGTACGGAAGAATTCATGTCTGAAGTCCGTCCGGCTCTGTTTGCTGCTGCCACTGACAAAACGGCCTCGCTAGACACTCGTACTGAGTGCTGTTCATCTCTGGCCGTACTCTGCTATCTGCTAGAAGAAGATCTCAATGAAATTTTAGAAGTAATGAAGATGTTTGAGACTATATTCAGCGGCAGCTACCTCAAGGGCGACGGCAGTGTGAAAATATCGGGAGCGGCGGTGGAGGAGGGGTCGTGGCACGCGGCCGCGCTGGACGGGTGGGCGCTACTGCTGGCGCTGCTGGACGGGCGACACGCCGCCGCCACGCTTCGCGAGCGCCCGCCCTCCTTCACCCGCCTGGCCGAGCTGCTGGACGCTTGCAGCCTGGACGTGCGCCTCGCGGCCGGCTGCGCCCTCGCCGCCGCGCACGAGCGGGCCGCGGACGGCGACGCGGACGGTCACGTGGCCTGGGACGAGCCCGCCGCCGCGCCGCGCCTGGCGCTGCTGGCGCGGGACTCGCACAAGTATCGCGCGAAGAGGGACCGTAAGCTGCAGCGCGCCACCTTCAGGGACATCCTCAAGTACTTCGAGGACGGCGAGATCGACGAGGAACGAGTCCGCGTGGGGGCGGAGACTCTGTGCGTGGACAGCTGGGCGGCGCGCGGCGCGTACTCGGCGCTGGCGGCGGCGCTCGGCGCCGGCCTGGCAGTGCTCGCGCCGCACGCGCCCGAGCTCCGGACCGCGCTGGGCCTGCCGCCGGCCGCGCCGCACGCCGCGCCTAGAGCTAAACTCAACAAGCTGCAGAGACATCTCCAGAACACGGCGGCGTGTAAAGCTCGCACACTGGCCCGCAATAAGAGTCGTGACAAGCGCTCGGCGGCGCTAGCTCTGTGA

Protein sequence:

>DPOGS210089-PA
MLVTALFLLTSLAQARPFNITHLIVPEVIAPGQEEVEIECRYDANFTLLNWFKGPNEFFRYRPGAAPSTRSFPVLGVGRVELIICGPTACRLKLGSLTEEATGLYRCDIERDVPPYKFATRTAYMEVHGHEHRKPLLEGLDEEFGEGDDMQAYCRGDPETEIRWYINGRELEEMRGASSLKRKSSRLIFLGIPPMVTVQCAEYKFGKLFGSNEERARWKDHVGSKDERPQEQRNLSAAVDMNIKHRRTELPYSSDEDAGIDMTNDNYSETSGQSDLRSHDDAGYQVALRSRQGRPRYPPLSVHKPTSFTYPLSELNNECTENEIQEKLEEKVLEIIDALSARANAARAAALVALRNALQRRYLAHLLSGQRVTLAEHITKALRRGKDGEKKAAAAVAPLLALQIGEEGTEEFMSEVRPALFAAATDKTASLDTRTECCSSLAVLCYLLEEDLNEILEVMKMFETIFSGSYLKGDGSVKISGAAVEEGSWHAAALDGWALLLALLDGRHAAATLRERPPSFTRLAELLDACSLDVRLAAGCALAAAHERAADGDADGHVAWDEPAAAPRLALLARDSHKYRAKRDRKLQRATFRDILKYFEDGEIDEERVRVGAETLCVDSWAARGAYSALAAALGAGLAVLAPHAPELRTALGLPPAAPHAAPRAKLNKLQRHLQNTAACKARTLARNKSRDKRSAALAL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: