MonarchBase - Protein-coding gene

DPOGS210641
Transcript	DPOGS210641-TA	1734 bp
Protein	DPOGS210641-PA	577 aa
Genomic position	DPSCF300401 - 203272-208167
RNAseq coverage	112x (Rank: top 59%)

Annotation
*Heliconius*	HMEL010783	7e-59	28.62%
*Bombyx*	BGIBMGA001632-TA	1e-96	42.15%
*Drosophila*	CG6654-PA	8e-23	28.21%
EBI UniRef50	UniRef50_E0VND5	4e-24	27.70%	Gonadotropin inducible transcription factor, putative n=2 Tax=Neoptera RepID=E0VND5_PEDHC
NCBI RefSeq	XP_002427629.1	7e-25	27.70%	gonadotropin inducible transcription factor, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242013882	1e-23	27.70%	gonadotropin inducible transcription factor, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|195395680	3e-29	30.58%	GJ10213 [Drosophila virilis]

Group
Gene Ontology	GO:0003676	9.4e-06	nucleic acid binding
KEGG pathway
InterPro domain	[465-504] IPR013087	9.4e-06	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL26726		Lepidoptera specific

Nucleotide sequence:

>DPOGS210641-TA
ATGTCCAACGTCTTGTGTTTTGTATGCTACGGCGCAGTTCATTCGGATATCAGTGACGGAACACGAGCTAAATACCGCGACTTCGTCGGCATTAGCCTGTGTCCGGAATCCCAGCTGTGCTACATATGCTGTCACATACTCAATAAGATGTGTATTTTCAAATCGCTGTGTCTTAAAAGGAGCACAGACTATCCTATATTTAGCGAAAAAGATATACTAAGATTACATATAACCGAAGTAAAGACACAAACGATTTGCGATGATGAATGCTGTGAACAACTTAAGGTAGATATAAAGAATTACAATGACAACTACGATGAAAATCTATGTGGGAATAACAAAGATATTGGTTCTGATGAGGATATTAACGGGTACGGCACAGACGATGATAATAATGGTGACATTAATTACTACGAATATAACATCAGTGATGCCTATCATGGCAATGAGGATGGAAAACAAAATGGAGGACATACAGAGGTGGGTTTGAAAGAAGATGTCGTGTTGGAGGATACATTAAATAATGATGTCAACGAAAATGACAGAAATGATAGTAATGATGGTAATGATGATAATGATGACCGGAATCATGATGTAATTAACAAGGATGATGTTAACGTGAGCGATGTGAAGAAAATGAGAAAGAATAGATTAAAGAAATCAAAAAGAAGGGGACTTATGAAGATAACTCTGACAGTTGAAGAACAGAGAGCTGAACTAGAAGCGAAGAGGAAGGAAAAGAAGTACACAGAGGCTGAGTTCAAGTGCTATAATTGTGCTATAGGATTCCTGTTCAAGGATACCTACCAGGCGCATATGATGCGTCACGAAGAGTCTAACGGTCAATACTCGTGTCCGATATGCACCCTCCGCGTGTCGTCTCTAACGCTGCTCCGCGTCCACGCCTCCCGTCATGCGGAGCGCTCCGTGTGCGTGAGGTGCGGGGTTCGAGTCCCCGGCAGGCACCACGTATGTAAGCACACGAGGACCAGGTCCCTGCCCTGCCACATGTGCGCTAGACTGTTCACGGACGCGAGTGGTCTCCAACAACATTTAAAACGAGTCCACACCAGCAAGACCAGCGGCAGACTCCACACCTGTACCGTCTGTGGCGAGACTTACAACACGCAGGCGGCTCTGAGGACGCATATGATTAAACATATAAAACGAAAATTCCCGTGTGAGCTGTGCCCGTCGGTGTACAGCAGTCCGTACACCCTGAACCAGCACATGAAGACCCATAACCAGGTGTCGGAGACATACTACTGCGAGACCTGCAACGTCAGCTTCACCTCCAGGAAGGGGCTGATGGCTCATAGACGGAACACGCTCAAACACCAACAGACCCTCTTCGAGTGTCCGATATGTGGTCGAGTGTGTCCCAACCAGCGAGCGCTGGCCTCACACATCCAGGCCGTCCACTCGTCCAGCAAGGAGTACAGCTGTTCCATGTGCAGCTCCAGCTACACTAGCAGGAAGTCGCTGGTCAGACACGTCGGAACGCACAGGAACAGCACAGGCGGGCCGCTGGCTGTGTGTCACCTGTGCGGGAACTGTTTCAAGGTCGGCCATTACGGGTTATATGTATGGAGCGTTTTATTTGAGAGTTATTTTATGTGTGATAACGACCTTGAAGGTCCAACTCAAGCAGAAAGACGCGACAATAATGCATCTCACGAAACGCCTGGCCCTTCTGGAAAGCCAGATCAAAAGCTGCCCCACATGTACAAATAA

Protein sequence:

>DPOGS210641-PA
MSNVLCFVCYGAVHSDISDGTRAKYRDFVGISLCPESQLCYICCHILNKMCIFKSLCLKRSTDYPIFSEKDILRLHITEVKTQTICDDECCEQLKVDIKNYNDNYDENLCGNNKDIGSDEDINGYGTDDDNNGDINYYEYNISDAYHGNEDGKQNGGHTEVGLKEDVVLEDTLNNDVNENDRNDSNDGNDDNDDRNHDVINKDDVNVSDVKKMRKNRLKKSKRRGLMKITLTVEEQRAELEAKRKEKKYTEAEFKCYNCAIGFLFKDTYQAHMMRHEESNGQYSCPICTLRVSSLTLLRVHASRHAERSVCVRCGVRVPGRHHVCKHTRTRSLPCHMCARLFTDASGLQQHLKRVHTSKTSGRLHTCTVCGETYNTQAALRTHMIKHIKRKFPCELCPSVYSSPYTLNQHMKTHNQVSETYYCETCNVSFTSRKGLMAHRRNTLKHQQTLFECPICGRVCPNQRALASHIQAVHSSSKEYSCSMCSSSYTSRKSLVRHVGTHRNSTGGPLAVCHLCGNCFKVGHYGLYVWSVLFESYFMCDNDLEGPTQAERRDNNASHETPGPSGKPDQKLPHMYK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: