yukicoder No.569 3 x N グリッドのパスの数

https://yukicoder.me/problems/no/569

解法そのものは自明だが、真面目にやるべきものではない。行列による解法の存在に気づければ、解は線形漸化式に従うことが分かるので、その性質を使って楽をする。

解の列に対する母関数 a(x) を考える。ここである多項式 f(x) が存在して、f(x)a(x) の次数が L で抑えられる(つまり次数が高い場所では係数が 0 になる)。このような多項式を線形回帰列に対する annihilator と呼ぶらしい。annihilator を求めるアルゴリズムとして Berlekamp-Massey アルゴリズムが知られている [1]。具体値が既知で漸化式が未知のときに漸化式を求めるアルゴリズムとも考えられる。

annihilator を計算する際に、数列の具体値を計算する必要がある。これは graphillion などの ZDD 関連のライブラリを用いて計算できるが、自分が書いたコードは何故か遅かった(何かテクニックがあるのだろうか?)。以前に simpath を書いたことがあったので、そちらを使うことにする [2]。フロンティアが極めて小さいため、各フェーズにおける状態数は10~20個程度にしかならない。そのため、n=30 程度までなら一瞬で計算できる。試しに n=10^5 で計算させてみたところ 1.58 秒で結果が得られた。

問題に関係のない simpath 関連のコードは以下の gist にまとめた。速さよりもコンパクトさを求めて書いた。まだ短くなる気がするので、劇的な改善策を見つけたい。コードもまだ綺麗とは言えない状態。『超高速グラフ列挙アルゴリズム』をまだ読んでないんだけど、もしかしたらコード、あるいは実装方法が載ってたりする?流石に載ってない?

https://gist.github.com/pekempey/80fb0978306cc077afa2800dd214cddd

[1] https://en.wikipedia.org/wiki/Berlekamp%E2%80%93Massey_algorithm
[2] http://pekempey.hatenablog.com/entry/2017/01/26/203424

ARC 082 E: ConvexScore

Keywords
convex hull DP
Time Complexity
\(O(N^3)\)

汎用的な処理が多数含まれているのでメモ。

#include <iostream>
#include <algorithm>
#include <vector>
#include <complex>
#include <cmath>
#include <cassert>
#include <tuple>

using namespace std;

constexpr long long mod = 998244353;

using P = complex<long long>;

long long dot(P a, P b) {
  return real(conj(a) * b);
}

long long cross(P a, P b) {
  return imag(conj(a) * b);
}

long long gcd(long long a, long long b) {
  a = abs(a);
  b = abs(b);
  if (b == 0) return a;
  return gcd(b, a % b);
}

// Get minimum element pointing in the same direction.
P tomato(P a) {
  long long g = gcd(a.real(), a.imag());
  return P(a.real() / g, a.imag() / g);
}

// Lexical order (argument, norm)
bool argcomp(P p1, P p2) {
  bool a = p1.imag() > 0 || (p1.imag() == 0 && p1.real() >= 0);
  bool b = p2.imag() > 0 || (p2.imag() == 0 && p2.real() >= 0);
  if (a != b) return a;
  long long c = p2.real() * p1.imag();
  long long d = p1.real() * p2.imag();
  if (c != d) return c < d;
  return norm(p1) < norm(p2);
}

namespace std {
  bool operator<(const P &a, const P &b) {
    return argcomp(a, b);
  }
}

int main() {
  int n;
  cin >> n;

  vector<P> ps(n);
  for (int i = 0; i < n; i++) {
    int x, y;
    cin >> x >> y;
    ps[i] = P(x, y);
  }

  vector<pair<int, int>> es;
  for (int i = 0; i < n; i++) {
    for (int j = 0; j < n; j++) {
      if (i == j) continue;
      es.emplace_back(i, j);
    }
  }
  // If two vectors are pointing same direction,
  // these are arranged such that both aren't taken.
  sort(es.begin(), es.end(), [&](pair<int, int> a, pair<int, int> b) {
    P d = ps[a.second] - ps[a.first];
    P e = ps[b.second] - ps[b.first];
    if (cross(d, e) == 0 && dot(d, e) >= 0) {
      return dot(ps[a.second] - ps[a.first], ps[b.first] - ps[a.first]) < 0;
    } else {
      return d < e;
    }
  });

  // Count the points inside (NOT on) the triangle(i,j,k)
  static int in[200][200][200];
  for (int j = 0; j < n; j++) {
    vector<pair<P, int>> qs;
    for (int i = 0; i < n; i++) {
      if (i == j) continue;
      qs.emplace_back(ps[i] - ps[j], i);
    }
    sort(qs.begin(), qs.end());
    for (int i = 0; i < n; i++) {
      if (i == j) continue;
      P s = tomato(ps[j] - ps[i]);
      int f = lower_bound(qs.begin(), qs.end(), make_pair(s, 0)) - qs.begin();
      for (int l = 0; l < n - 1; l++) {
        int k = qs[(f + l) % (n - 1)].second;
        in[i][j][k] -= l + 1;
        in[j][k][i] -= l + 1;
        in[k][i][j] -= l + 1;
      }
    }
  }
  static int on[200][200];
  for (int i = 0; i < n; i++) {
    for (int j = 0; j < n; j++) {
      if (i == j) continue;
      for (int k = 0; k < n; k++) {
        if (i == k || j == k) continue;
        on[i][j] += cross(ps[k] - ps[i], ps[j] - ps[i]) == 0 && dot(ps[k] - ps[i], ps[j] - ps[i]) > 0 && dot(ps[k] - ps[j], ps[i] - ps[j]) > 0;
        in[i][j][k] = max(0, in[i][j][k] + n);
      }
    }
  }

  vector<long long> two(n + 1);
  two[0] = 1;
  for (int i = 1; i <= n; i++) {
    two[i] = two[i - 1] * 2 % mod;
  }

  // Easy
  long long ans = 0;
  for (int i = 0; i < n; i++) {
    vector<long long> dp1(n);
    vector<long long> dp2(n);
    for (auto e : es) {
      int u = e.first;
      int v = e.second;

      if (u == i) {
        assert(dp1[v] == 0);
        dp1[v] = two[on[u][v]];
      } else if (v == i) {
        dp2[v] += dp2[u];
      } else {
        int c = on[i][v] + on[u][v] + in[i][u][v];
        dp2[v] += dp1[u] * two[c];
        dp2[v] += dp2[u] * two[c];
      }
      dp2[v] %= mod;
    }
    ans += dp2[i];
    ans %= mod;
  }

  cout << ans << endl;
}

AIM Tech Round 4 (Div. 1) D. Dynamic Shortest Path

http://codeforces.com/contest/843/problem/D

Keywords
SSSP | reweighting technique
Time Complexity
\( O(Q(N+M)) \)

Explanation

最小費用流や、負辺を含む全点対最短経路[1]などで用いられるポテンシャルを用いたreweightテクニックを使う。

Reweight

グラフ \(G\) における単一始点最短経路長を \(d(u)\) とする。このとき \(w'( (u,v))=w( (u,v))-d(u)+d(v)\) と置き直したグラフ \(G'\) における最短経路と \(G\) における最短経路は一致する。

元グラフ\(G\)の重みが\(w_2\)に変わった(非減少に変化)とき、新たな最短経路長を計算したいとする。このグラフの最短経路長を \(d_2(u)\) としたとき、先程と同様に \(w_2'( (u,v))=w_2( (u,v))-d(u)+d(v)\) と変形したとしても、やはり最短経路は変わらない。

最短経路が変わらないというのは、\(d_2'(u)=d_2(u)+d(u) \) だからである。\(-d(u)+d(v)\)の補正が最短経路長に与える影響が経路に依存していない(これがポテンシャルと呼ばれる由来だろう)ことから、最短経路が変化しないことが言える。

この問題を解く。reweighted graphにおける最短経路長はすべて 0 である。ここで重み増加クエリが来たとしても reweighted graph の最短経路は \(n\) でバウンドできる。つまり \(n\) 個 queue を持っておけば線形 dijkstra が可能である。

TLEしたため、type 2のクエリをやや溜めている。

#include <iostream>
#include <algorithm>
#include <vector>
#include <queue>

using namespace std;

constexpr int N = 1e5;
int n, m, q;
int us[N], vs[N], ww[N];
vector<int> g[N];
long long dist[N];
int dist2[N];
vector<int> que[N*2];

void dijkstra() {
  for (int i = 0; i < n; i++) {
    dist[i] = 1e16;
  }
  priority_queue<pair<long long, int>> q;
  q.emplace(0, 0);
  dist[0] = 0;
  while (!q.empty()) {
    long long d = -q.top().first;
    int u = q.top().second;
    q.pop();
    if (dist[u] < d) continue;
    for (int id : g[u]) {
      int v = vs[id];
      if (dist[v] > dist[u] + ww[id]) {
        dist[v] = dist[u] + ww[id];
        q.emplace(-dist[v], v);
      }
    }
  }
}

int cap;

void dijkstra2() {
  if (cap == 0) return;
  que[0].push_back(0);
  for (int i = 0; i < n; i++) {
    dist2[i] = cap;
  }
  dist2[0] = 0;
  for (int d = 0; d < cap; d++) {
    while (!que[d].empty()) {
      int u = que[d].back(); que[d].pop_back();
      if (dist2[u] < d) continue;
      for (int id : g[u]) {
        int v = vs[id];
        int w = min<long long>(cap, ww[id] + dist[u] - dist[v]);
        if (dist2[v] > dist2[u] + w && dist2[u] + w < cap) {
          dist2[v] = dist2[u] + w;
          que[dist2[v]].push_back(v);
        }
      }
    }
  }
  for (int i = 0; i < n; i++) {
    dist[i] += dist2[i];
  }
  cap = 0;
}

int main() {
  cin >> n >> m >> q;
  for (int i = 0; i < m; i++) {
    scanf("%d %d %d", &us[i], &vs[i], &ww[i]);
    us[i]--;
    vs[i]--;
    g[us[i]].push_back(i);
  }
  dijkstra();
  while (q--) {
    int type;
    scanf("%d", &type);
    if (type == 1) {
      dijkstra2();
      int v;
      scanf("%d", &v);
      if (dist[v - 1] >= 1e16) {
        puts("-1");
      } else {
        printf("%lld\n", dist[v - 1]);
      }
    } else {
      int c;
      scanf("%d", &c);
      while (c--) {
        int l;
        scanf("%d", &l);
        ww[l - 1]++;
      }
      cap += n;
      if (cap == n*2) dijkstra2();
    }
  }
}

ポテンシャルは何でも良いが、ポテンシャルに最短経路長を用いることで三角不等式により全辺の重みを非負にすることができる。APSP では SSSP を n 回行うという方法が考えられるが、負辺が存在する場合に Dijkstra 法が使えない。そこで Bellman-Ford 法を用いて負辺を除去し、Dijkstra 法が使える状態に落ちし込む。これが Johnson's algorithm である。

References

[1]
https://en.wikipedia.org/wiki/Johnson%27s_algorithm. Retrieved 2017-08-29

Goldman Sachs CodeSprint: Transaction Certificates

keywords
rolling hash | birthday attack

解法

ハッシュ値が重複するまでひたすら生成し続けるだけで高速に発見できることが知られている。これは誕生日攻撃と呼ばれている。nが小さい場合は重複値が存在しない可能性があるので、100以上になるまで大きくしておく。

#include <iostream>
#include <algorithm>
#include <map>
#include <vector>

using namespace std;

int main() {
  int n, k, p;
  unsigned long long m;
  cin >> n >> k >> p >> m;

  int u = 1;
  while (n * u < 100) {
    u++;
  }
  n *= u;

  auto gen = [&](int seed) {
    unsigned long long x = seed;
    vector<int> val;
    for (int i = 0; i < n; i++) {
      x ^= x << 13;
      x ^= x >> 7;
      x ^= x << 17;
      val.push_back(x % k + 1);
    }
    return val;
  };

  auto calc_hash = [&](vector<int> a) {
    long long hash = 0;
    for (long long x : a) {
      hash = (hash * p + x) & (m - 1);
    }
    return hash;
  };

  map<unsigned, int> mp;
  
  for (int i = 1;; i++) {
    long long hash = calc_hash(gen(i));
    if (mp.count(hash)) {
      for (long long x : gen(i)) {
        cout << x << ' ';
      }
      cout << endl;
      for (long long x : gen(mp[hash])) {
        cout << x << ' ';
      }
      return 0;
    } else {
      mp[hash] = i;
    }
  }
}

二冪なので他にも攻略法があって、それはhos氏のブログが参考になる。

文字列 \(110000\) と文字列 \(000011\) の rolling hash はそれぞれ

\begin{equation}
1x^5+1x^4+0x^3+0x^2+0x^1+0 \\
0x^5+0x^4+0x^3+0x^2+1x^1+1
\end{equation}

であり、その差は \(x^5+x^4-x-1\) である。この多項式は \(x\) が奇数のとき常に \(32\) の倍数になる。つまり法を \(32\)、基数を奇数としたとき必ず衝突する。法が二冪であればこのような多項式が容易に構成できる。

\(v(n)\) を \(2\) が \(n\) を割り切る回数とし、多項式 \(f\) に対して

\begin{equation}
V(f)=\min_{n \in 2\mathbb{Z}+1}v(f(n))
\end{equation}

とする。\(V(f) \ge 32\) となる多項式 \(f\) を見つければ良い。\(V(x^{2k} - 1) = V( (x^k - 1) (x^k+1) ) \ge 1+V(x^k - 1)\) なので、

\begin{equation}
V( (x-1)(x^2-1)(x^4-1)\cdots(x^{128}-1) ) \ge 32
\end{equation}

である。これは展開時の係数がすべて \(\pm 1\) であり、さらにその係数は組合せ的に求まる。

n, k, p, m = map(int, input().split())
# (x-1)(x^2-1)(x^4-1)(x^8-1)(x^16-1)(x^32-1)(x^64-1)(x^128-1)
#  1    2      3      4      5       6       7      8        >32
n = (256+n-1)//n*n
ans = [0]*(n-256) + [(-1)**bin(i).count('1') for i in range(256)]

mp1 = {0: 1, 1: 2, -1: 1}
mp2 = {0: 1, 1: 1, -1: 2}
print(*[mp1[v] for v in ans])
print(*[mp2[v] for v in ans])

補足

  • よく考えると基数が偶数 \((p=2)\) のときバグる。
  • \(x\) が奇数のとき \(x^2+1\) は \(4k+2\) 型の整数になるので、\(v(x^2+1)=1\) である。これにより厳密に \( v(x^{2^k} - 1)=v(x^2-1)+k \) である。この結果は LTE補題に似ているが、LTE補題は偶素数と奇素数で振る舞いがわずかに異なることに注意。
  • 対二冪の多項式の係数列を Thue-Morse sequence というらしいですね。

August Long Challenge 2017: Flower Pots

CHTのO(BN^2)解を最初投げたんだけど通らなかった。解法は難しくないにも関わらず通している人が少ないのは集団心理か何かだろうか。

計算量
\(O(BN^2)\)
キーワード
DP

解説

まずDPで解くことを考える。状態は着火区間と経過秒数とする。\( [L,R] \rightarrow [L',R'] \)に遷移するパターンは3つある。

  • \(L\)から\(L'\)に伝播、\(R\)から\(R'\)に伝播
  • \(L\)から\(L'\)と\(R'\)に伝播
  • \(R\)から\(L'\)と\(R'\)に伝播

この問題を解く鍵は遷移2or3は複数回起きないということである。最適構造の雰囲気を図1に示す。


f:id:pekempey:20170817154309p:plain

図1. 最適構造

最適解にならないケースを図2に示す。\( C\to y\)に直接繋げた方がコストは小さくなる。


f:id:pekempey:20170817161026p:plain

図2. 最適解にならないケース

ということでDPしなくても分岐地点を全探索すれば良いことがわかる。\(x\)を固定したとき、そのコストを知るには \( dist_b(1,\ast),dist_b(n,\ast),dist_b(c,\ast) \) が必要である――何手掛かったかを知る必要があるため下付きの b として表現した――。これは多少手を抜いたO(BN^2)のDPで計算したとしても間に合う。

起点 \(x\) を決めたとき、伝播先(l,r)はO(N)通りしかないことに注意したい。

#include <iostream>
#include <algorithm>
#include <vector>

using namespace std;

void upd(long long &x, long long y) {
  x = min(x, y);
}

constexpr int N = 3000;
int n, b, c;
long long a[N];
long long ll[N][N], rr[N][N], cc[N][N];

void solve() {
  cin >> n >> b >> c;
  for (int i = 0; i < n; i++) {
    cin >> a[i];
  }
  c--;

  auto dist = [&](int i, int j) {
    return (a[i] - a[j]) * (a[i] - a[j]);
  };

  constexpr long long inf = 1.1e16;
  fill_n(*ll, N*N, inf);
  fill_n(*rr, N*N, inf);
  fill_n(*cc, N*N, inf);
  ll[0][0] = 0;
  rr[0][n - 1] = 0;
  cc[0][c] = 0;
  for (int i = 0; i + 1 < b; i++) {
    for (int j = 0; j < n; j++) {
      for (int k = 0; k < n; k++) {
        upd(ll[i + 1][k], ll[i][j] + dist(k, j));
        upd(rr[i + 1][k], rr[i][j] + dist(k, j));
        upd(cc[i + 1][k], cc[i][j] + dist(k, j));
      }
    }
  }

  long long ans = inf;
  for (int i = 0; i < n; i++) {
    int l = i;
    int r = i;
    while (l != 0 || r != n - 1) {
      if (l == 0) {
        r++;
      } else if (r == n - 1) {
        l--;
      } else if (a[i] - a[l - 1] == a[r + 1] - a[i]) {
        l--;
        r++;
      } else if (a[i] - a[l - 1] < a[r + 1] - a[i]) {
        l--;
      } else {
        r++;
      }
      for (int j = 0; j < b; j++) {
        upd(ans, cc[j][i] + max(dist(i, l), dist(i, r)) + ll[b - j - 1][l] + rr[b - j - 1][r]);
      }
    }
  }
  cout << ans << endl;
}

int main() {
  int T;
  cin >> T;
  while (T--) solve();
}