MonarchBase - Protein-coding gene

DPOGS209945
Transcript	DPOGS209945-TA	1626 bp
Protein	DPOGS209945-PA	541 aa
Genomic position	DPSCF300148 - 361072-365612
RNAseq coverage	277x (Rank: top 39%)

Annotation
*Heliconius*	HMEL010000	4e-69	55.52%
*Bombyx*	BGIBMGA011262-TA	8e-78	42.75%
*Drosophila*			%
EBI UniRef50	UniRef50_Q5RH01	5e-09	31.25%	Condensin-2 complex subunit H2 n=2 Tax=Danio rerio RepID=CNDH2_DANRE
NCBI RefSeq	XP_002399696.1	9e-10	34.62%	condensin-2 complex subunit H2, putative [Ixodes scapularis]
NCBI nr blastp	gi\|148922258	1e-08	29.32%	Si:dkey-202b22.2 [Danio rerio]
NCBI nr blastx	gi\|322495303	3e-18	25.54%	proteophosphoglycan ppg1 [Leishmania mexicana MHOM/GT/2001/U1103]

Group
KEGG pathway
InterPro domain	[58-99] IPR009378	3.4e-06	Non-SMC condensin II complex, subunit H2-like
Orthology group	MCL25827		Lepidoptera specific

Nucleotide sequence:

>DPOGS209945-TA
ATGAATTCCCAAAGGCTGGAGGAGATAGTGGCGGAGCTGATGAAGCCAATCAGCGACGTCCGCCGCAGTTTCGACACGGATCTCAGCGCGTTACTGGAGGAGTACCTGACGGAGGCGGGGCAACAGGCTCTAGAAGCCGAGGCCAGTGGCAATCATTGCTACAACACACCTAATTTTGCAGAGGTGGCTCTCTTGCTACAGCAGTCGGCCAGTATCTATGGTCGCAAAGTGGACTGTCTCTACTCTCATGTGCTATGTGTCAGTGATGCGCTTCACAATAACACTCAAGAAACTAACGTGTTGGCCGACGAGACGCACACTCCCAGCGGCGGCCGGAGGAAACGGAAGGCGTCCGTCAGCGGCGACTTCGACTACATCGCGCTGGAGACCTGCGGCGCCGCGCGTAGGGACGCCGGGCCCTCGCGACCCCCGCCCACACTGCCCAGGATGTACGTGGAGCTCGAGCCCAGAGTCGTTTCCTCACACGACCATCAGCTCACAGATTACCTCGGGGAGCCCATAGGACTGTTGGCGGACTTCAACGTCTCGTGGAGGCTACGGAACGGGTTGCTGGTAGATGAGCTGGCTAGCACCGAGGGCGGCGCACCGGGACTGCGACCTGCGCCGCTGCTGGAGCTGCGTGCGGCCATGGAAGCCGCCGCGCCTCCCTCGCCCCCGCCCGCGACCTCCTCCCCCCCTCCTGCGCCCTCCTCACCCCGGCCCGAGCAACCCTCTTCACCGCCGCCGTCCGCTCCTGACTCGTGTTCGACGCCTCTGCCCCAAAGGAAGGAGGTTAGGAGGAAGCGACGGAGCGAAGTCAAACTTGAGGATATTGTGGACGGACAAGTCAAACTGCTTATCAGCAAAGAGTTGCGAGGTAAGTTGCGGCGTGTTGAGGAGTTCAGCTTGCCGGTGGACTGGGTCGCCAGGGTCGTGGAGGGCCGCGCCTCCGCCGTGAGGGAGCTTCGGCGCGGACTGCGGGGACACCGCGCCGAGACAGAATTCCGCGGCTTCGACGTGACGAACTCTATGGACGTTGGAGGGTTCCTCGGCTGGAGCGGGCCGGAGGCGGCGGCGGCGGCGGCGGCGCTCAGCGCGGCCGCCGCCGCCAGGCTCGACGACAGCGACGACGACGGCTTCTTCGAACAGAGCTCGCTCGGCGACTCCGACACCTCGCGCGCCGACGACACCGGCGCCACCGCGCTCTCGGTACCTACGCGCCCTATCCCGCGACCTCCCCGGCGACCCCTTGTAACAGCAGGCGTGTGCTTCCAGTCGTTGCCGGGCAGCGGCTGCGAGTGGTGGAGCTGGCGCGAGGCGGTGGTGTCGCGCAGCACGGCGGCGGCGGCGCGCGGCGCCGATGTGAAGGAGGGTGCGCGGGCCGTGCTCGCGGCGGCCGGCGCGCTGCCCTCGCCCGCCGCCTTCGACGCGGTGCTGGCGGCCGCCGCCGAGCAGACGCACGACGTGTCCCGCCTGTTCCTGTCCGCGCTGTTCCTGGCCAACGCGGGCTCCATCGAGATCGTGCCGGGCGCCCCCCTGTCGCTGAACTCGTTCGGCATCCGCGTGTTGTCTCGCGACGAGCGTCTCTACCTGTCGGTGGTGGAGGACCGTCCGCCGCCGCGGTAG

Protein sequence:

>DPOGS209945-PA
MNSQRLEEIVAELMKPISDVRRSFDTDLSALLEEYLTEAGQQALEAEASGNHCYNTPNFAEVALLLQQSASIYGRKVDCLYSHVLCVSDALHNNTQETNVLADETHTPSGGRRKRKASVSGDFDYIALETCGAARRDAGPSRPPPTLPRMYVELEPRVVSSHDHQLTDYLGEPIGLLADFNVSWRLRNGLLVDELASTEGGAPGLRPAPLLELRAAMEAAAPPSPPPATSSPPPAPSSPRPEQPSSPPPSAPDSCSTPLPQRKEVRRKRRSEVKLEDIVDGQVKLLISKELRGKLRRVEEFSLPVDWVARVVEGRASAVRELRRGLRGHRAETEFRGFDVTNSMDVGGFLGWSGPEAAAAAAALSAAAAARLDDSDDDGFFEQSSLGDSDTSRADDTGATALSVPTRPIPRPPRRPLVTAGVCFQSLPGSGCEWWSWREAVVSRSTAAAARGADVKEGARAVLAAAGALPSPAAFDAVLAAAAEQTHDVSRLFLSALFLANAGSIEIVPGAPLSLNSFGIRVLSRDERLYLSVVEDRPPPR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: