jupyter非表示コード/jupyterテーブルフォーマット

3075 ワード

Python分析モデリング、日常問題整理(七)
2018.09.03~2018.09.09
  • 1推定を拒否
  • 一般的に、風制御モデルでは、貸付された客群だけが善し悪しマーク(期限切れかどうか)を持っているが、貸付されていない一部の客群にはモデルに入っていない.時間が経つにつれて、モデルの最適化反復は、モデルに入るのはますます良い客群である.風制御モデルが実際に直面している客群には「採点が悪い」ユーザーが含まれており、モデルは「採点が悪い」ユーザーの中で検証できず、訓練のモデルがますます実際の状況から逸脱し、拒否されるべき多くの悪いユーザーを通過し、大量の不良債権が発生し、直接巨大な経済損失をもたらしている.そのため、最も良質な貸付ユーザーの善し悪しラベルしかない場合、モデリングがすべての貸付ユーザーと拒否ユーザーに対して良好なソート能力を持つことをどのように保証するかは、推定を拒否する思想を用いる必要がある.
  • 2 jupyter非表示コード
  • ファイルをエクスポートするときに出力しますが、コードを隠すことができます.ボタンをクリックして隠すことができます.
    from IPython.display import HTML
    
    HTML('''
    code_show=true; 
    function code_toggle() {
     if (code_show){
     $('div.input').hide();
     } else {
     $('div.input').show();
     }
     code_show = !code_show
    } 
    $( document ).ready(code_toggle);
    
    
    ''')

    ファイルをエクスポートするときは、出力も非表示もしないで、よく使いましょう.
    import IPython.core.display as di;
    di.display_html('jQuery(function() {if (jQuery("body.notebook_app").length == 0) \
                    { jQuery(".input_area").toggle(); jQuery(".prompt").toggle();}});', raw=True)
    
  • 3 datafameテーブルフォーマットpyechartsとmarkdownを組み合わせて、きれいな分析レポートを出力します.この応用はexcelにおける条件付きフォーマット−データバー−色次などの機能に類似している.
  • def color_negative_red(val):
        """
                     
        """
        color = 'red' if val < 0.3 else 'black'
        return 'color: %s' % color
    dat_all.head().ix[:,2:].style.applymap(color_negative_red)
    
    def highlight_max(s):
        '''
        highlight the maximum in a Series yellow.
            /         
        '''
        return ['background-color: yellow' if v == s.max() else '' for v in s]
    
    df.style.apply(highlight_max,axis=1)
    
    cm = sns.light_palette("green", as_cmap=True)
    df.style.bar(subset=['a','b','c','d'], color='#5fba7d')
                  
    df.style.bar(subset=['a','b','c','d'], color='#5fba7d').applymap(color_negative_red)
                   ,          
    '''
                  ,              
    '''
    df.style.applymap(color_negative_red).apply(highlight_max,axis=1)
    
    def highlight_max(data, color='yellow'):
        '''
        highlight the maximum in a Series or DataFrame
                    
        '''
        attr = 'background-color: {}'.format(color)
        if data.ndim == 1:  # Series from .apply(axis=0) or axis=1
            is_max = data == data.max()
            return [attr if v else '' for v in is_max]
        else:  # from .apply(axis=None)
            is_max = data == data.max().max()
            return pd.DataFrame(np.where(is_max, attr, ''),
                                index=data.index, columns=data.columns)
    df.style.apply(highlight_max, color='darkorange', axis=None)
    

    ↓df.スタイル公式ドキュメント
  • 4 dataframeのある列をインデックスdfとする.set_index(["Column"], inplace=True)